Gene Dhaf_1008 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dhaf_1008
Symbol
ID	7257976
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfitobacterium hafniense DCB-2
Kingdom	Bacteria
Replicon accession	NC_011830
Strand	+
Start bp	1096123
End bp	1097265
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	52%
IMG OID	643560922
Product	Collagen triple helix repeat protein
Protein accession	YP_002457504
Protein GI	219667069
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGAGT TAACCACCGG TTTGATAGAT AATTTTCCGG TTAATGGGGC ACGCCCCTCA 
GTATCGGTAG CCCTTAGAAT TACCAACGAT GGTGATTCCA CGGAGACGGT TAGAATAACC 
GGCTACTATC CCAATGGGTC TTTCAAAGAA GTATATGTTT TAGAAATAGT TAATGTTAAT 
CCAAATGAGG TGATAACTCG AGAGTATTTC GCTGATCTGG ATGCTTTTGA ATTTGTATTC 
TCGACAAGTT CTGAAACGGT AGCTATATCG GTATGGGGTA AAGACGCTGA AGGGAACTTA 
GTGGATGCCC ATCGGGTGCT CCCTGCTGAA TTGGATTCAC TGGAACCAAT AATAGGACCC 
ACAGGGGAGA CCGGAGCCAC GGGAGCTACA GGAGAGACCG GGGCAACGGG GCCCACAGGA 
GAGACCGGCG CAACAGGGGC CACAGGGGAA ACTGGTGCAA CAGGAGCTAC AGGAGAGACC 
GGCGCAACAG GGGCCACAGG GGAAACTGGT GCAACAGGAG CCACAGGAGA GACCGGCGCA 
ACAGGGGCTA CAGGGGAAAC TGGTGCAACA GGAGCCACAG GGGAGACCGG CGCAACAGGG 
GCCACAGGGG AAACTGGTGC AACAGGAGCC ACAGGAGAGA CCGGCGCAAC AGGGGCTACA 
GGAGAGACCG GCCCGACCGG ACCTACAGGT TCCACAGGAC CAACCGGTGG AGCTGGATCA 
TTATCTGGGC TCCAGGTTCA GTTGCAGGGA AGCAGTGGAG GTACGGTCGC CAATAATGCC 
AATGTCCTGT TTGACACTAC AATCAACGCT CCTTCCGCAA ACATCACTTA TAATGCCGGA 
ACTGGAACCT TTTTTATCAA TCAGCCGGGA AATTACTATA TTTCCTGGTG GGTTAACACA 
GATGGGGCCG AAGCAGAGCC TACGGTGTCT TTTGGCATCC GGGTTATTAG CGGCGGTTCG 
CAGACCATTT TATCGTCTTC CCCTTCGCCG ATGGTGACAT TACAGTTAAA TGGAAATGCT 
TTGCTTACGG TGACAACGAC TCCGCTGGTC TTTAACCTGT TTAATAACAG CGGCGCGACG 
GTCTCCTATG GCACGTCGGC TGTCCAGGCA GACTTGACTA TTGTTGAAGT AGCATCACTG 
TAA

Protein sequence

MAELTTGLID NFPVNGARPS VSVALRITND GDSTETVRIT GYYPNGSFKE VYVLEIVNVN 
PNEVITREYF ADLDAFEFVF STSSETVAIS VWGKDAEGNL VDAHRVLPAE LDSLEPIIGP 
TGETGATGAT GETGATGPTG ETGATGATGE TGATGATGET GATGATGETG ATGATGETGA 
TGATGETGAT GATGETGATG ATGETGATGA TGETGATGAT GETGPTGPTG STGPTGGAGS 
LSGLQVQLQG SSGGTVANNA NVLFDTTINA PSANITYNAG TGTFFINQPG NYYISWWVNT 
DGAEAEPTVS FGIRVISGGS QTILSSSPSP MVTLQLNGNA LLTVTTTPLV FNLFNNSGAT 
VSYGTSAVQA DLTIVEVASL