Gene Dshi_1043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_1043
Symbol
ID	5711011
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	-
Start bp	1076851
End bp	1077846
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	68%
IMG OID	641266954
Product	TRAP dicarboxylate transporter- DctP subunit
Protein accession	YP_001532386
Protein GI	159043592
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.000669152
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACTGC ATACCCGACT TCTCGCCGCC GGCGCGGCCC TTCTTCTGGC GGCCCCGGCG 
CTGTCCCAGG AGGCCCGGCT GAGCGTGGTC TACTCGCTGC CTGCGACAAA CGACCTGATG 
CAAAGCTATT TCGCCTTCGT CGAGGACGTG AACGCCAATG GCGCGGGCAT CCTGCAAATC 
GACCTGCGCG GCGGCACCGA GATCCTGCCC CGGAACGAGC AGATGAACGC GGTCTCGCGC 
GGGATCATCG ACCTCTATTT CGGGCCGGCA GGCTATTACC AGCGCCAGGT GCCGGAGCTG 
ACCCCGCTCG ACGCCGCCGC GGTGCCTGCC GACAAGCTGC GCGCCGCGGG GCTGCACGAC 
GCCATCGATG CCGGCACGCG GGAGCGCGCG GGCGTGGCGT TCCTGGGCGC GATGGGGACG 
GGATACAATT TCCAGTTCTA CACCATCACC GAGCCCAAGA TCGACGATGA CGGCACGATG 
GATTTCTCGG GGCTCAAGAT CCGCGGCGGC GCATCCTATG ACCCGATGTA CCAGGCGCTC 
GGCATCGCCC GGGTCGATGT GCCCGCGGGC GATATCTATA CCGCGCTGGA ACGCGGGCTG 
GTCGAGGGGA TCGGGTTCAC CACCATCGGG GTCAGCTCCG GCGGATGGCA GGATTTCCTG 
CGCTACCGGA TCTTCCCGAC CTGGCGCCAG GGCAACACGA TCATCGCCGC GAACGCCGCG 
AAATTCGACG GGCTGACCGA GGAGCAGCGC GCCTACCTGA TGGAGATGAT CCAGAAGCAC 
GAGATGCTGG CCTATGACGC CGCCAAGGCG CTGGAGGCGG TGGATACCGC CGCCCTGGCC 
GAGGCGGGCG TGCAGGATGT CGTGCTCGAA GGCGCGGGCG CCGCCGAGGT CACCGCCGCC 
TTCCAGGACA CGTTCTGGGT CAACGTGGCC GAGACCCTGG GCGAGGACGC GGCCGCCAAG 
TACCGCGCCA TCATCGACGC GGCCAACGGC AGCTGA

Protein sequence

MTLHTRLLAA GAALLLAAPA LSQEARLSVV YSLPATNDLM QSYFAFVEDV NANGAGILQI 
DLRGGTEILP RNEQMNAVSR GIIDLYFGPA GYYQRQVPEL TPLDAAAVPA DKLRAAGLHD 
AIDAGTRERA GVAFLGAMGT GYNFQFYTIT EPKIDDDGTM DFSGLKIRGG ASYDPMYQAL 
GIARVDVPAG DIYTALERGL VEGIGFTTIG VSSGGWQDFL RYRIFPTWRQ GNTIIAANAA 
KFDGLTEEQR AYLMEMIQKH EMLAYDAAKA LEAVDTAALA EAGVQDVVLE GAGAAEVTAA 
FQDTFWVNVA ETLGEDAAAK YRAIIDAANG S