Gene TM1040_2418 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2418
Symbol
ID	4076744
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	2559491
End bp	2560564
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	59%
IMG OID	638007740
Product	ABC transporter related
Protein accession	YP_614412
Protein GI	99082258
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0403436
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.72438
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAAGA TTACACTGTC GAAACTGCGG CACAGCTACC TTTCAAATCC CAAATCCGAC 
AGCGACTACG CGCTGAAGGA AATCGATCTT GATTGGCAGG ACGGCGGCGC CTACGCGCTG 
CTCGGCCCGT CAGGCTGCGG CAAATCCACC CTGCTCAATA TCATTTCGGG CCTTCTGGTG 
CCGTCTGAAG GGCAGATCCT CTTTGACGGT CAGGACGTCA CCAAACTGCC CCCAGATCAG 
CGCAACATCG CACAGGTCTT TCAGTTCCCG GTCATCTACG ACACCATGAC CGTCTACGAC 
AATCTGGCGT TTCCCCTGCG CAATCGTGGC CGGGACGAGG CCACGGTGGA ACAGCGCGTC 
ATGGCGATTG CCGAGATGCT CGAAGTCACC GAGATGCTGA ACCAGAAGGC GGCGGGGCTG 
TCTCCTGACA ACAAACAGAA GATCTCCATG GGCCGCGGCC TCGTGCGTGA GGACGTGAAC 
GTAGTGATGT TCGACGAACC GCTCACGGTG ATCGACCCGC ATCTGAAGTG GAAACTCCGC 
TCCAAGCTCA AGGAGCTGCA TCAGCGGGTC AAAGCGACCA TGATCTACGT CACCCACGAC 
CAGACAGAGG CGCTGACTTT TGCGGATCAG GTGGTCGTAA TGCAGCTGGG TGAAGTGGTG 
CAGATCGGCA CGCCGGTTGA GCTCTTCGAA CGCCCTGCAC ATACCTTTGT GGGTCACTTC 
ATCGGCTCTC CGGGCATGAA CATCATTCCC TGCAGTTATG ACGGCGCGGC GAAGGTCGAA 
GGTCACGACA TTGTGCTGGA AGGGCCGGTG CGCGGCACCC CCAATGGTCA GACCGAAATC 
GGCATCCGTC CGGAGTTTGT GTCTCTCTCC GACAGCGGCC TGCCCGCGAC TGTGACCAAA 
GTCTCGGACG TAGGGCGGCA CACGGTCGTT GAATGCGACT GCCTTGGTCA CAAGGTGAAT 
GCCGTGATCG AAGAGGGCGC AGCACCTGAA AAAGGGGCGC AAACCCACCT CGCCTTCCGC 
CAAGACCAGA CCCGCCTTTA TGTGGATGGC TGGCTCGCCA CTGATCCGGA GTAA

Protein sequence

MAKITLSKLR HSYLSNPKSD SDYALKEIDL DWQDGGAYAL LGPSGCGKST LLNIISGLLV 
PSEGQILFDG QDVTKLPPDQ RNIAQVFQFP VIYDTMTVYD NLAFPLRNRG RDEATVEQRV 
MAIAEMLEVT EMLNQKAAGL SPDNKQKISM GRGLVREDVN VVMFDEPLTV IDPHLKWKLR 
SKLKELHQRV KATMIYVTHD QTEALTFADQ VVVMQLGEVV QIGTPVELFE RPAHTFVGHF 
IGSPGMNIIP CSYDGAAKVE GHDIVLEGPV RGTPNGQTEI GIRPEFVSLS DSGLPATVTK 
VSDVGRHTVV ECDCLGHKVN AVIEEGAAPE KGAQTHLAFR QDQTRLYVDG WLATDPE