Gene Daro_3974 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3974
Symbol
ID	3567473
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	4270786
End bp	4271970
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	65%
IMG OID	637682447
Product	Ni-Fe hydrogenase, small subunit:twin-arginine translocation pathway signal
Protein accession	YP_287171
Protein GI	71909584
COG category	[C] Energy production and conversion
COG ID	[COG1740] Ni,Fe-hydrogenase I small subunit
TIGRFAM ID	[TIGR00391] hydrogenase (NiFe) small subunit (hydA) [TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	52
Plasmid unclonability p-value	0.871152
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAACC AAAATTTGAT TTCGCTGGAA CAGGACGATC GCATCGAAGC TGCGGCTGCG 
CGTTTGTCGA TGGACCGGCG GGAGTTCCTG CAGTTCTGTG CCGCACTGGC GACCACACTG 
GGCCTGCCGC AAGGCGCCGA TGCCGCGGTG GCCGAGGCGG TGGCGACCAA GAAGCGGCCG 
AGCGTGATCT GGCTGCACTT CCAGGAATGC ACCGGGTGCA CCGAGTCCAT CTTGCGGGCC 
GAGCACCCGA CGCTGGAAAA ACTGATCCTT GACGTCATTT CGCTCGACTA TCACGAGACG 
CTGTTCGCAG CGGCCGGCCA TCAGGTCGAA GCCGCCCGCA AGACGGCGAT GGCCGAGAAC 
AAGGGCAAGT ACATCCTGGT CGTCGAGGGC GCCATTCCGA CGCGCGACAA CGGCATCTAC 
TGCAAGATTG GCGGCAAGAC GGCGATAGAG TTGCTCACGG AATGCGCGGC TGACGCGGCG 
GCAGTGATCG CCATCGGCTC TTGCGCCTCG TGGGGCGGCA TGCCCTCGAC CGATCCTAAC 
CCGACCGGCG CCAAGGGCGT GGACAAGGTG CTCGGCAAGC CGGTGGTGAC CATTCCCGGT 
TGCCCGCCCA ATCCGTACAA TTTCCTGTCC ACGGTGGTGC ATTTCCTGAC CTTCGGCGCG 
TTGCCGGCCG TTGATCATCT GGGGCGGCCA AAATTTGCCT ACTCCCGCCT GATCCACGAA 
AACTGCGAGC GCCGCGCCCA CTTCGACGCC GGCCGCTTCG CCATGGAGTT TGGCGACGAA 
GGCCACCGCA AGGGTCATTG CCTGTACAAG CTGGGCTGCA AGGGGCCGGA AACCTACGCC 
AATTGCTCGG TGATCATGTT CGGCGATGCC GGGGCCGGCA CCTGGCCGGT CGCCTGCGGC 
CACCCGTGCA TCGGCTGTAC TGAGCAAGGG GTCGGCTTCA CCAAGCCGAT CCATACCGTC 
GCCAAGCTGA AGAACATCGA ACCCTCCGCC TTCCTGCCGC GCATCGTCGA GGAAAAGGGC 
GTTGGCGCGT CGCTCGGCTC GGCGGCCGTG CTGGCCGCCG TGGCCGGTGC CGCCGCCGGG 
GCTGGCGCGA TGGTCGCCAA GAACCTCGGC CTGTCGCACA AGGCTGAGGA GATGGAACAG 
GCCAAGAAGG AAGGCAGCAA AGCCACCGAA TCAACGGAGG TCTGA

Protein sequence

MANQNLISLE QDDRIEAAAA RLSMDRREFL QFCAALATTL GLPQGADAAV AEAVATKKRP 
SVIWLHFQEC TGCTESILRA EHPTLEKLIL DVISLDYHET LFAAAGHQVE AARKTAMAEN 
KGKYILVVEG AIPTRDNGIY CKIGGKTAIE LLTECAADAA AVIAIGSCAS WGGMPSTDPN 
PTGAKGVDKV LGKPVVTIPG CPPNPYNFLS TVVHFLTFGA LPAVDHLGRP KFAYSRLIHE 
NCERRAHFDA GRFAMEFGDE GHRKGHCLYK LGCKGPETYA NCSVIMFGDA GAGTWPVACG 
HPCIGCTEQG VGFTKPIHTV AKLKNIEPSA FLPRIVEEKG VGASLGSAAV LAAVAGAAAG 
AGAMVAKNLG LSHKAEEMEQ AKKEGSKATE STEV