Gene TM1040_2417 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2417
Symbol
ID	4076743
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	2558405
End bp	2559481
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	61%
IMG OID	638007739
Product	ABC transporter related
Protein accession	YP_614411
Protein GI	99082257
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0208356
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.753894
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACTCG AACTCAGATC CGTGACCAAA CGCGTGGGCG GTGATCTCCA TATCAAGGAG 
ACCTCCCTGA CGCTCGAGCC CGGTCACTTC AACGTCCTTC TGGGCGCCAC CGGGTCGGGA 
AAGACCTCTC TTATCAAGAT GATGGCCGGG CTTGACCCGA TTGCCTCCGG CTCTGTCCTC 
ATGGACGGGC AGGACGTGAC CCGCCTCAAC ACACAAAAGC GCAACATCAG CCTTGTGCAT 
CAGTTTTTCA TCAACTACCC GCACATGACG GTCTACGACA ATATCGCCTC GCCACTCAAA 
GTTGCGGGCA TGGCAAAGTC GGAACTTGAT GACCGCGTGC AGGAAGCGGC GAAAATTCTG 
CAGCTCACCC CAATGTTGCA TCGCCGCCCG CACGAGCTCT CTGGCGGTCA GCAGCAGCGG 
ACCGCGCTGG CGCGTGCGAT TGCAAAGGAA AGCCGCGCTG TCTTCCTCGA CGAGCCGCTG 
GCGAACCTCG ACTATAAGCT GCGCGAGGAA TTGCGCGATC AGCTGCCGGA GCTCTTTGCC 
GGTCGTGGCG CGGTTGTGGT CTATGCCACC TCTGAGCCCG AAGAGGCGCT CCTTCTTGGC 
GGCAAGACAG CACTCATGCG CGATGGCCGC GTGACCCAAT TCGGCCCCAC CGCAGAGATC 
TATCGCAATC CTGAAAACGT CGAAGCCGCA CGCGTGTTCT CCGACCCGCC GATCAACACG 
GCGACAATCA CCAAACAAGG CTTTGAGGCG CGTTTGGGGC CGGATGTGCG CTGGACCCTG 
GATGGCGCGG CTGCCAGCCT GAAGGACGGC ACCTACACCA TCGCAATCCG CCCGCATCAT 
GTCACCCCGG TGGCATCCTC GGCAGGACTG GTAAGACTCA ACGGTCGCGT GCAGGTGACA 
GAGCTATCCG GTTCCGAAAG CTCGGCGCAT TTCGATCTTG CGGCCTCCGG GCAGGAAACC 
TCCTGGGTGT CCCTGAGCCA CGGCGTCCAC CCCTACGAGG TTGGCGAATT GCATGATTTC 
TATATGGACC CGCGGGCGGC ATATGTCTTT GCCCCTGACG GCTCCCGCGT GGCGTGA

Protein sequence

MALELRSVTK RVGGDLHIKE TSLTLEPGHF NVLLGATGSG KTSLIKMMAG LDPIASGSVL 
MDGQDVTRLN TQKRNISLVH QFFINYPHMT VYDNIASPLK VAGMAKSELD DRVQEAAKIL 
QLTPMLHRRP HELSGGQQQR TALARAIAKE SRAVFLDEPL ANLDYKLREE LRDQLPELFA 
GRGAVVVYAT SEPEEALLLG GKTALMRDGR VTQFGPTAEI YRNPENVEAA RVFSDPPINT 
ATITKQGFEA RLGPDVRWTL DGAAASLKDG TYTIAIRPHH VTPVASSAGL VRLNGRVQVT 
ELSGSESSAH FDLAASGQET SWVSLSHGVH PYEVGELHDF YMDPRAAYVF APDGSRVA