Gene TM1040_3131 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3131
Symbol
ID	4075003
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	-
Start bp	105191
End bp	106237
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	58%
IMG OID	638004634
Product	TRAP dicarboxylate transporter- DctP subunit
Protein accession	YP_611367
Protein GI	99078109
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.722243
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACTC GCAGAGCACT ACTTGGTGCA GCCACCGCAC TGGCATTTTC CGCAATGGGC 
GCAGTGCCCG CCTTCGCGCA GGAGGTGACG CTGAAGCTGC ACCAGTTCCT GCCCGCACAG 
GCCAATGTGC CAAAGCTCAT TCTGGATGTC TGGGCAGACA AGATCGAAGA CGCATCGGGC 
GATCGTATCA AGATTGACCG CTACCCCTCG ATGCAGCTGG GCGGCAAGCC GCCAGAATTG 
ATTGATCAGG TTCAGGACGG CGTTGCCGAT ATCGTCTGGA CCGTGGTGGG CTACACGCCG 
GGTCGTTTCC CATCGACCGA AGTGTTTGAG CTGCCCTTTA TGATGACCAA TGCACGTGCC 
GCAAGCCACG CCTATTGGGA CATGATGGAA GATCATTGGC TGGACACCGA ATTCAAGGAC 
TTCAAGATCC TTGCAGGGTG GGTGCATGGT CCGGGCATCT TCCACACCTC TGATCCGGTC 
GAAGTACCAA AGGATCTTGA GGGCATGAAA ATTCGCGGTG GTGGGCGCTC TGTAAACGCC 
TTGCTGACCG AGCTGGGCGC AACACCTGTC GGCATGCCTG TGCCGTCCAT TCCCGAAGCG 
CTCTCGAAGG GCGTGATTGA TGGGACCACC ATCCCATGGG AGGTGACCAC CGCCCTGAAA 
GTGCCGGAAC TTGTTGAAAA CCATACCGAA TTCTCGGGCC GCGCGCTGTA CACGCTGACC 
TTTGTTCTGG CGATGAACAA GGAAAAATAC GACAGCCTGC CTGATGACCT GAAGAAGGTG 
ATCGACGACA ACTCCGGTGT CGAGATGTCT GTCTTTGCAG GCGGCACGAT GGCAGATTCG 
GACATGCCCG CGCGTGAAAA CGCGCTGGAT CTCGGCAACA ATGTGATCAC GCTCGACGCG 
GATCAGACGG CCGTGTGGCG CGAGCGCTCT CAGCCGATCT ACGACAAGTG GCTCGCCGAT 
ATGTCGGAGC GCGGCATCGA CGGTCAGGCG CTTCTGGATG AGGCGACCAT GCTGATCGAC 
AAATATACGC CGCAGTACGA AAACTGA

Protein sequence

MTTRRALLGA ATALAFSAMG AVPAFAQEVT LKLHQFLPAQ ANVPKLILDV WADKIEDASG 
DRIKIDRYPS MQLGGKPPEL IDQVQDGVAD IVWTVVGYTP GRFPSTEVFE LPFMMTNARA 
ASHAYWDMME DHWLDTEFKD FKILAGWVHG PGIFHTSDPV EVPKDLEGMK IRGGGRSVNA 
LLTELGATPV GMPVPSIPEA LSKGVIDGTT IPWEVTTALK VPELVENHTE FSGRALYTLT 
FVLAMNKEKY DSLPDDLKKV IDDNSGVEMS VFAGGTMADS DMPARENALD LGNNVITLDA 
DQTAVWRERS QPIYDKWLAD MSERGIDGQA LLDEATMLID KYTPQYEN