Gene TM1040_3357 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3357
Symbol
ID	4075256
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	-
Start bp	368526
End bp	369584
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	59%
IMG OID	638004865
Product	TRAP dicarboxylate transporter- DctP subunit
Protein accession	YP_611591
Protein GI	99078333
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.422667
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.485488
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCAAAA CTTTGGTTAA GACAGCTGCG CTGTCGGTGC TTCTGGCAGG CACCGCCCTG 
ACAGCAAGTG CTGCCGATTA CACACTGCGT GCAACGGCAA ACTCGAACGA AAACGACGAA 
GACTACGATG GCCTCGTGGT TTTCAAAAAC TACGTCGAAG CCGCATCCAA TGGCGCCATC 
GAAGTGGAGC TGTTCATCGG TACGCAGCTG TGCTCGAACG GGGCGGAATG CCTTCAGGGC 
GTCGCGGATG GTTCGATTGA CATCTATATC TCGACCTCGG GCGGTGCCTC CGGCCTGTTC 
CCCTATGTGC AGGTTCTGGA CCTTCCGTAT CTGATGGCGG ACGACCGGAT TGCAGAGCAT 
GTCCTGTCCG GTGATTTCAC CCGCACCATG CGGGACATGG CTCTGGAAGA TTCCGGCGAC 
ACCATTCGTC TGATGACCAT CGGCAACACC GGCGGTTGGC GCAACTTTGC CAACACCAAA 
CGCCGCATCG CAGAGCCTGC GGACATGGAA GGTTTGAAGA TTCGCACCGT GGTTGCGGAC 
CTGCCGCAAG AACTGGTCAA AGCCCTGGGT GCATCCCCGA CCCCGATCCC GTGGCCGGAA 
CTGTTCACCT CCTTTCAGAC CGGAGTTGTT GAAGGGTCGA AGAACGGTAT CACCGACATC 
ATGGGCATGA AGTTCCCCGA TGCTGGTTTG CAGTATGTCA CCCTGGATGG CCACGCCTAC 
ATGGGGGCCT TGTGGTGGAT GTCGAACCAA AGCTTCCAGG CGATGCCGGA AGACATGCGC 
CGCGTGGTTG TGGACGGCTT CTACGCGCTG CAGCAGGCGA CCTTCGCGTC TCCGAAGCGT 
AAATCCATCG CGGCTTACGA AGAATTCGTA GCAGGTGGTG GCGACCTCTA CGTACCGACC 
CCGGACCAGA AAGCCGCCTT CAAAGAAGCC GCTTCCCCGG TCTACGACTG GTTCAAGTCC 
AACGTGACCC GTGGTGACGA AATCTTCACC GCGCTGACCG ACGCCGTGGC AGCTGCCGAG 
GCCGAGATCG ACGCGGATCG CGCTAAAGAC CTGAAATAA

Protein sequence

MLKTLVKTAA LSVLLAGTAL TASAADYTLR ATANSNENDE DYDGLVVFKN YVEAASNGAI 
EVELFIGTQL CSNGAECLQG VADGSIDIYI STSGGASGLF PYVQVLDLPY LMADDRIAEH 
VLSGDFTRTM RDMALEDSGD TIRLMTIGNT GGWRNFANTK RRIAEPADME GLKIRTVVAD 
LPQELVKALG ASPTPIPWPE LFTSFQTGVV EGSKNGITDI MGMKFPDAGL QYVTLDGHAY 
MGALWWMSNQ SFQAMPEDMR RVVVDGFYAL QQATFASPKR KSIAAYEEFV AGGGDLYVPT 
PDQKAAFKEA ASPVYDWFKS NVTRGDEIFT ALTDAVAAAE AEIDADRAKD LK