Gene Dhaf_1007 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dhaf_1007
Symbol
ID	7257975
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfitobacterium hafniense DCB-2
Kingdom	Bacteria
Replicon accession	NC_011830
Strand	+
Start bp	1094502
End bp	1095839
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	51%
IMG OID	643560921
Product	Collagen triple helix repeat protein
Protein accession	YP_002457503
Protein GI	219667068
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGAGT TAACCACTGG TTTGATAGAT AATTTTCCGG TTGATGGAGC GCGGCCCTCG 
GTATCGGTAG CCCTTAGAAT TACCAATGAT GGTGATTCTA CGGAGACGGT TACCATAACC 
GGCTACTATC TCAATGGGAC TATCAAAGAA GTATATGTTT TAGAACTAGT TACTGTTAAT 
CCAAATGAGG TAATAATCCG GGAGTATTAT GCTAATTTGG ATGCTTTTGA ATTTGTATTC 
TCGACAAGTT CTGAAACGGT AGTTATATCG GTATGGGGTA AGGACGCTGA AGGGAATTTA 
GTAGATGCCC ATCGGGTGCT CCCTGCTGAG TTGGATTCAC TGGAACCGAT TATAGTGCCG 
ACGGGGCCCA CAGGAGAGAC CGGAGCCACA GGAGCAACCG GGGCAACAGG GCCCACAGGA 
GCAACCGGAA CAACGGGAGC TACAGGAGAG GCCGGAGCAA CGGGAGCCAC AGGGGAGACC 
GGGGCAACGG GAGCCACAGG GGAGACCGGG GCCACAGGGG CCACAGGAGA GACCGGGGCC 
ACAGGGGCCA CAGGAGAGAC CGGAGCAACG GGGGCTACAG GAGAGACTGG TGCAACGGGA 
GCTACAGGAG AGACTGGTGC AACGGGAGCT ACAGGAGAGA CTGGTGCAAC AGGGCCCGCA 
GGAGAGACCG GGGCCACAGG GGCTACAGGA GAGACTGGTG CAACGGGGGC CACAGGAGAA 
ATCGGAGCGA CAGGGGCTAC AGGAGAGACT GGAGCGACAG GGGCTACAGG AGAGACTGGA 
GCGACAGGGG CTACAGGAGA GACTGGGGCG ACAGGGGCCA CAGGAGAAAC TGGAGCGACA 
GGGGCTACAG GAGAGACCGG AGCAACGGGA GCCACAGGAG AGACCGGGGA GACTGGTCCG 
ACTGGTCCTA CCGGAGAAGT CGTTTTGGCT TTTGGATCTT TAAGAGGAAG TAGTGCAGAG 
GCACCTGGGG CAACATTCAC ACCCGTACCG TTTAGTATAG TTGGACCTTT ATCAGATACT 
ATCACAGTTA GTCTATCGGG CAATGAATTA GTGGTAGGGG AAAGCGGAAT TTATCAAATA 
ACAATATCTA TTAACGCTCA AGCCACTACT GATCCAGATC CTGATGACCC ATATCTGGAG 
GCTATTATCA CTGTCAATGG TTCGCCAATT TTTGGCGATA CAACCACTTT CTTTAAAATA 
TTTAATAGAA GTAGTTCAAC GTTTGTAGTT CAAGCATCTT TAACAGCAGG AGATGAAGTA 
GGAGTGAGTG CTAGTACGGA TTTCCCTATT TTAGGTTATA TAAATCGCTC CTTAACTGTT 
GTTCAATTAA GTAATTAA

Protein sequence

MAELTTGLID NFPVDGARPS VSVALRITND GDSTETVTIT GYYLNGTIKE VYVLELVTVN 
PNEVIIREYY ANLDAFEFVF STSSETVVIS VWGKDAEGNL VDAHRVLPAE LDSLEPIIVP 
TGPTGETGAT GATGATGPTG ATGTTGATGE AGATGATGET GATGATGETG ATGATGETGA 
TGATGETGAT GATGETGATG ATGETGATGA TGETGATGPA GETGATGATG ETGATGATGE 
IGATGATGET GATGATGETG ATGATGETGA TGATGETGAT GATGETGATG ATGETGETGP 
TGPTGEVVLA FGSLRGSSAE APGATFTPVP FSIVGPLSDT ITVSLSGNEL VVGESGIYQI 
TISINAQATT DPDPDDPYLE AIITVNGSPI FGDTTTFFKI FNRSSSTFVV QASLTAGDEV 
GVSASTDFPI LGYINRSLTV VQLSN