Gene Dshi_1041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_1041
Symbol
ID	5711009
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	-
Start bp	1075005
End bp	1076324
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	63%
IMG OID	641266952
Product	TRAP dicarboxylate transporter
Protein accession	YP_001532384
Protein GI	159043590
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1593] TRAP-type C4-dicarboxylate transport system, large permease component
TIGRFAM ID	[TIGR00786] TRAP transporter, DctM subunit

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.128417
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCATGG AATGGTGGGA AGCGGCCCTT CTGATGCTCG GGATGGTGAT CGGGCTGATG 
GCGCTTTGTG TGCCGGTGGC CTTTGCCTTC CTCATCGCGA ACCTGATCGG GGCCTATATC 
TTCATGGGCG GGCTGATCGG GGTCGAGCAG CTGGTCGCCA ATACCGGGGA GGCTGTGTCG 
AGCTTCGTGC TGGTCACGGT GCCGATGTTC GTGCTGATGG GGAACCTGTT TTTCCATTCC 
GGCATCGCGC TGAAGATCAT CGAGACGCTC GACCGATCCA TGGGCCGCTC CACCGGGCGG 
CTCAGCTACA TATCCGTTCT CTGCGGAACA ATCTTCGCCG CCCTGTCGGG GTCCAACATG 
GCCAACACGG CGATGATGGG GGGGCTGCTG CTGCCGCAGA TGGAAGAACG GAAGTACCAG 
CGCCATATGT CCATCGGCCC GATCATCGGC TCGGGGGGAC TGGCACTGCT GATCCCGCCC 
TCGACACTCG CGGTGCTCTT GGGCTCCATC GCGCAGATCA GCATCGCGGA CCTGCTGCTG 
GCGGGTGTGC TGCCGGGGCT GGTGCTCGCG CTGCTCTACG TGGCGACGAT CTGGCTGCAA 
CTGCGGCGCA ACCCTCAGGC CGCGCCCGCC TATGACGTGG TGACCGCGCC GTTCTGGGAA 
AAGATCCGCC TGATCTGCAC CTATATCCTG CCCATGTCTC TGGTGGTGTT CTGTGTTGTC 
GGGTTGATCC TGCTGGGCAT CACCACCCCG TCGGAGGCCG CGGCCTTCGG CGTGCTGTCG 
GTGCTTGTGC TGTCGATCCT TTATGGCCGG TTCTCATGGG ACATGGTCGC GAAATCCCTC 
GAAGGCACCC TGCGCGTGTC GGTCATGGTG TTCTTCATCA TCATCGCCTC GAAAACCTTC 
AGCCAGGTGC TGGCGTTTTC CGGGGCGACC TCGGGGATGA TCGCATGGGC GACCTCCTAC 
GAATTCGCGC CGATCACCAT GCTGTTGATC ATGTTCGTCG TGCTGCTGAT CCTGGGGATG 
TTCGTCGATG CGATCTCGAT GATGCTGCTG ACGATCCCGA TCTTCTTTCC CATCGCCGCC 
GCCATGGGGT TCGATCCGAT CTGGTTCGGC CTCGTGATGC TGCTGGCCAT CGAGATGAGC 
GGAACGACAC CGCCCTTTGG CCTGTTGTTG TTCGTGATGC AGGGGGTGGC GCCGCCGGGC 
ACGACCTATT GGACCATCGT GCGGGCGGCC GCGCCTTACC TGATCTGTGA CCTGATCCTG 
CTGGTCGGGC TGATCGCGGT GCCTGCGCTG GCGCTGTGGC TGCCGGGGCT GAGGTTCTGA

Protein sequence

MLMEWWEAAL LMLGMVIGLM ALCVPVAFAF LIANLIGAYI FMGGLIGVEQ LVANTGEAVS 
SFVLVTVPMF VLMGNLFFHS GIALKIIETL DRSMGRSTGR LSYISVLCGT IFAALSGSNM 
ANTAMMGGLL LPQMEERKYQ RHMSIGPIIG SGGLALLIPP STLAVLLGSI AQISIADLLL 
AGVLPGLVLA LLYVATIWLQ LRRNPQAAPA YDVVTAPFWE KIRLICTYIL PMSLVVFCVV 
GLILLGITTP SEAAAFGVLS VLVLSILYGR FSWDMVAKSL EGTLRVSVMV FFIIIASKTF 
SQVLAFSGAT SGMIAWATSY EFAPITMLLI MFVVLLILGM FVDAISMMLL TIPIFFPIAA 
AMGFDPIWFG LVMLLAIEMS GTTPPFGLLL FVMQGVAPPG TTYWTIVRAA APYLICDLIL 
LVGLIAVPAL ALWLPGLRF