Gene Dhaf_1038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dhaf_1038
Symbol
ID	7258006
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfitobacterium hafniense DCB-2
Kingdom	Bacteria
Replicon accession	NC_011830
Strand	+
Start bp	1134236
End bp	1135384
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	51%
IMG OID	643560952
Product	cysteine desulfurase family protein
Protein accession	YP_002457534
Protein GI	219667099
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01977] cysteine desulfurase family protein

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.000028217
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTTACT TTGATAATGC GGCAACAACT TGGCCCAAAC CGGAATGCGT TTATGAGGCA 
GTGGATCAAT GCTTGCGCAA CAAAGGAGCG AATCCCAGCC GCTCCGGTCA TTTTATGGCC 
TTGCTTGCCG GGCAGATTGT CCTCAATGCC CGAGTGCAAA TCGCCGAGTT TTTTAATATC 
TCTGACCCCT TGCAAGTGGT GTTTACTCCC AATGCCACCG AAGCTCTTAA TATAGGCCTG 
AAAGGGCTAT TAAAACCGGG AGACCATGTG CTTACCAGCT CTCTTGAACA TAATGCTGTA 
ACCCGCCCCC TGGAAAAGCT GCGCAGCCAG GGTGTAGAGG TAACCAAGCT GCCGACATCT 
GTGCAGGAGG GATTGTATCC TGAGCAGGTG GCAGCAGCTA TTCAGAACAA TACCAAGCTC 
ATCGTCCTCA GCCATGCTTC CAATGTGATG GGGTTAATTC AGCCTATTGG TGAGATCGGC 
AGAATTGCCG GGGAAAAGGG TGTCCTTTTT ATGGTGGATT CTGCCCAGAC TGCAGGTTCC 
ATGCCCATCG ATGTTCAGGC TATGGGCATC GACCTTTTGG TATTTGCCGG GCATAAAGGG 
TTATTGGGGC CTCAAGGGAC AGGCGGCTTG TATCTTCGTG AAGATTTGCG TCTCGATACC 
CTGAAGGAAG GAGGAACCGG AGCGAATTCA GAGGAACCCT TCCAGCCGGA AGAGAGCCCG 
GAGCGCTATG AGAGCGGAAC CCTCAATACA CCGGGAATTG CAGGTCTGGG AGCAGGTATA 
GAATTCATCA AGCAGGAAGG AATAGAGAAG ATACGGGAAA AGGAAAGAAC CCTCACCCGC 
CAGTTGATGC TGGGCTTAAG CGCAATACCC GGCGTTATTC TTTATGGCCC TGACCCTTCT 
GTAGAAAGGG CGCCTGTCGT GTCTATTAAC CTGGAGGGAA GGGAACCTTC GGAAGTTTCC 
TATCTCTTGG ATAAGCTTTA TGGAATCGCG TCAAGACCGG GCTTGCATTG TGCCCCCGAT 
GCCCACAAAA CCCTTGGTAC CTTCCAACAA GGAACAGTTC GTTTAAGCTT AGGGTACTTT 
AATACCAGCC AAGAGGTGGA GGAGTGTCTG GATGCGGTTG CCGGACTCAG TTCCCCGAAC 
AAGAAATAA

Protein sequence

MIYFDNAATT WPKPECVYEA VDQCLRNKGA NPSRSGHFMA LLAGQIVLNA RVQIAEFFNI 
SDPLQVVFTP NATEALNIGL KGLLKPGDHV LTSSLEHNAV TRPLEKLRSQ GVEVTKLPTS 
VQEGLYPEQV AAAIQNNTKL IVLSHASNVM GLIQPIGEIG RIAGEKGVLF MVDSAQTAGS 
MPIDVQAMGI DLLVFAGHKG LLGPQGTGGL YLREDLRLDT LKEGGTGANS EEPFQPEESP 
ERYESGTLNT PGIAGLGAGI EFIKQEGIEK IREKERTLTR QLMLGLSAIP GVILYGPDPS 
VERAPVVSIN LEGREPSEVS YLLDKLYGIA SRPGLHCAPD AHKTLGTFQQ GTVRLSLGYF 
NTSQEVEECL DAVAGLSSPN KK