Gene Daro_3960 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3960
Symbol
ID	3567459
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	4257038
End bp	4258456
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	66%
IMG OID	637682433
Product	nickel-dependent hydrogenase, large subunit
Protein accession	YP_287157
Protein GI	71909570
COG category	[C] Energy production and conversion
COG ID	[COG0374] Ni,Fe-hydrogenase I large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	51
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCGCC TCATCGTCGG GCCGTTCAAC CGGGTCGAAG GCGATCTCGA AATCAGCCTC 
GATGTGGAAA ATGGACGCAT CCAGTCGGCT CAGGTCAATT CGCCGCTCTT TCGCGGTTTC 
GAGCAGATCA TGGTTGGCCG GGCCCCGCTT GATGCATTGG CCATCGTGCC GCGCATCTGT 
GGTATTTGCT CGGTGGCACA GTCGGCGGCA GCGGCTTCGG CGCTGGCCGA TGCGATGGGT 
ATCGCCCCGA CGCCGAACGG GTTGCTCGCC CGCCATCTGA TCCAGTCGAC GGAAAATCTG 
GCCGATCACC TGACGCACTT CTACCTCTTT TTCATGCCCG ACTTTGCCCG TCCGGCCTAT 
GCCGGGCGCC ACTGGCATGG CGCTGTCGCC CAGCGCTTCG CGGCCGTCAA GGGTGATGCC 
ACTGCCGAAG TCCTGTCGGC CCGCGCCAGC TTCCTCAAGC TGATGGGTTT TCTCGCCGGT 
CGCTGGCCGC ACACCCTGGC CATTCAGCCC GGTGGCAGCA CGCGGGCGAT CACTGCTGGC 
GAGCGTATTC GCCTGCTGGC GCTGCTCCGC GAATTCCGTA GCTTTCTCGA AAAACGCCTG 
TTCGGCGATT CGTTGGCCAC GGTCTCCCAA CTGGCCAGCA AAGATCAATT GCTCGCCTGG 
GCCGCCGGCC GTGCTGGTGA CTTCCCGGCG TTTCTGGATG CCGCTACCGA TCTTGGTCTC 
GACCGGATGG GAAGCGCCTA CGATGCTTTC CTGTCCTATG GCGCCTACGA TCTCTTTCCC 
GCCGGCACCT GGCAAGGCGG TCAAGCGGCT GCCTTCGATC CCGTGGCGAT CGATGAAGAC 
ACGACCAGCG CCTGGCTGGC TGCCGGCCAG CCGCGCCATC CGGCGCAGGG TGAAACGGTT 
GTCGATGCCG GCAAGCCGGC GGCCTACACC TGGTGCAAGG CACCGCGCTA CGCCAGCCAG 
CCCTACGAAG TCGGTGCGTT GGCCAGGCAG GTCATCGCCG GTCACCCGCT GGCGTTGGAT 
CTGGTACAAC GCGACGGCGC CAGCGTCATG GCTCGCGTCG TTGCACGCCT GCTCGAACTG 
GCCCTTGTCC TGCCCGCCAT GGAAGGCTGG GTTCTGGCGC TACAACCCGG CGAAGCCTTC 
TGCGCCCACG GCGATATGCC CGATGACGCC ACTGGCACCG GCCTTGTCGA AGCCGCCCGC 
GGCAGCCTCG GCCACTGGCT GAGCATCAAG CGTGGCCGCA TCGAGCGCTA CCAGATCATC 
GCCCCGACCA CCTGGAACTT CTCGCCGCGT GATGGCAACG CCCTGCCCGG TCCGCTCGAA 
CAGGCACTGG TCGGCCTGCC GGCCGGAGAG GGCGCCCCGC CAACCGTGCA GCACGTCGTG 
CGGTCGTTCG ATCCTTGCAT GGTCTGTACC GTGCATTAG

Protein sequence

MTRLIVGPFN RVEGDLEISL DVENGRIQSA QVNSPLFRGF EQIMVGRAPL DALAIVPRIC 
GICSVAQSAA AASALADAMG IAPTPNGLLA RHLIQSTENL ADHLTHFYLF FMPDFARPAY 
AGRHWHGAVA QRFAAVKGDA TAEVLSARAS FLKLMGFLAG RWPHTLAIQP GGSTRAITAG 
ERIRLLALLR EFRSFLEKRL FGDSLATVSQ LASKDQLLAW AAGRAGDFPA FLDAATDLGL 
DRMGSAYDAF LSYGAYDLFP AGTWQGGQAA AFDPVAIDED TTSAWLAAGQ PRHPAQGETV 
VDAGKPAAYT WCKAPRYASQ PYEVGALARQ VIAGHPLALD LVQRDGASVM ARVVARLLEL 
ALVLPAMEGW VLALQPGEAF CAHGDMPDDA TGTGLVEAAR GSLGHWLSIK RGRIERYQII 
APTTWNFSPR DGNALPGPLE QALVGLPAGE GAPPTVQHVV RSFDPCMVCT VH