Gene Dshi_3471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_3471
Symbol
ID	5712529
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	-
Start bp	3653928
End bp	3654965
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	62%
IMG OID	641269400
Product	protein of unknown function DUF898 transmembrane
Protein accession	YP_001534805
Protein GI	159046011
COG category	[S] Function unknown
COG ID	[COG4269] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAAC AGGTTGAGTT CAAGGGCGAT ACCGGCGAGT GGTTCGGGAT CTGGATCGTC 
AACATCGTCC TGACGATCCT GACCATCGGG ATCTACTCGG CCTGGGCCAA GGTCCGGACC 
AAGCAATATT TTTATCGCAA CACGATCATT GGCGGGCGCA GCTTCGACTA CCACGCCACA 
GGTTTGCAAA TCCTGATCGG GCGAGTCATC GTGATCGTCG GGCTGATCGC CTATTCGTTG 
CTTGCCGCGA TCCCGGTGCT CGCGATCCTG CTGCCCCTCG GGTTTCTGGC GCTCTTTCCG 
TTCCTGATGT ACCGCTCCTT TCGCTTCAAC GCGCGGGTCA GCAGCTGGTC CGGCGTGCGG 
TTCAACTTCG CGGGCACCTA TGGCGGGGCG TTCAAGGCCT ATTTGCTGGC GCCGTTCCTG 
ACGGCGCTCA CCGCCTATCT CGCCTGGCCT TTCGCTGAAC GTGCCCAGCG GCGCTATGTC 
GTCAACGGGC ATCGGCTAGG GCGGACGCCG TTTACCTTTG ACGCGCCCAT CGGGCCCTTT 
TACAGAGCCT TTTTCGCCGC CATCGGCTGG TTCTTCGCGG TGCTGATCTG CGGCGCGCTG 
CTCAGCAGCA TGATCCCGGA CGCCCTGCCG AGACCGCAGA ACATGACCGC GCAGGACATG 
CGGATCCTGG CCCTGGTTCT GTCCATCCTA CCCTTCGCGG TCTTCGGCTT TTTCACCGCC 
TTGGTGCTGT TCCGGGCCAT GGTCCGCAAT ATCGTCTACA ACGCGGTCTT ACTGGACCGG 
AAGCACCGCT TCGTGTCCAC CGTGTCACCC TTGCAGGTGC TGTGGATCGC GGTAACCAAT 
GGCGTGGCGG TGATATTGAC GCTCGGGCTG GCCCTGCCCT GGGCGCAGAT CCGGCTGGCG 
CGCTACTTCG CGGCGGAAAC CCGGTTCGTT CCCGACGGCT CCCTCGACAA CTTCATCGCC 
CATTTCGAGC AGGAGAAGGG TGCCTTCGGC GATGCCTTCA CCGATATCGA AGGGCTCGAT 
TTCGGGATCA ACCTCTAG

Protein sequence

MSEQVEFKGD TGEWFGIWIV NIVLTILTIG IYSAWAKVRT KQYFYRNTII GGRSFDYHAT 
GLQILIGRVI VIVGLIAYSL LAAIPVLAIL LPLGFLALFP FLMYRSFRFN ARVSSWSGVR 
FNFAGTYGGA FKAYLLAPFL TALTAYLAWP FAERAQRRYV VNGHRLGRTP FTFDAPIGPF 
YRAFFAAIGW FFAVLICGAL LSSMIPDALP RPQNMTAQDM RILALVLSIL PFAVFGFFTA 
LVLFRAMVRN IVYNAVLLDR KHRFVSTVSP LQVLWIAVTN GVAVILTLGL ALPWAQIRLA 
RYFAAETRFV PDGSLDNFIA HFEQEKGAFG DAFTDIEGLD FGINL