Gene Avin_04400 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_04400
Symbol	hoxH
ID	7759399
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	417280
End bp	418539
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	70%
IMG OID	643803361
Product	Soluble nickel-dependent hydrogenase, large subunit, HoxH
Protein accession	YP_002797671
Protein GI	226942598
COG category	[C] Energy production and conversion
COG ID	[COG3259] Coenzyme F420-reducing hydrogenase, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCCGCG TCGAGGGCGA GGGCTCCCTC GACCTGCACA TCGAAGGCGA CCGGGTCGTC 
GCGGCGCGGC TCGGCATCTT CGAGCCGCCG CGCTTCTTCG AGGCCTTCCT GCGCGGGCGC 
GGCCATGCCG AGGTGGCGGA CATGGTGGCG CGGATCTGTG GCATCTGCCC GGTGGCCTAC 
CAGATGAGCG CGGTGCACGC CCTGGAAAAC GCCTTCGGCG TGCGGGTCGA GGGGCAATTG 
CGCGCGCTGC GCCGGTTGCT CTACTGCGGC GAGTGGATCG AAAGCCACGC GCTGCATGTG 
GTGATGCTGC ACGCCCCGGA CTTTCTCGGC TATCCGGACG CGATCCGCAT GGCGGCCGGG 
CACGGCGACC GGGTGCGCGA CGCCCTGGCG CTGAAGAAGG CCGGCAACTC GATAATCCGC 
CTGCTCGGCG GGCGCGAGAT CCACCCGGTC AACGTCCGGG TCGGCGGCTT CTACCGCGTG 
CCGAGCCGCG CCGAGCTGGC GCCGCTGGCC GAGGAACTGG ATCGGGCCCG CGACATCGCC 
GTCGGGCTGG TGCGCTGGGT GGCGGGCTTT CCCTTTCCGC ACATCGAACG GGACTACGAG 
TTCGTCGCCC TGCGCCATCC GCACGAATAC CCGCTCAACG AGGGACGGCT GGTATCCAGC 
CGCGGCCTCG ATATCGACAT CGCCGATTAC GAGACGGAGT TCGAGGAGCG CCAAGTGCCG 
CACTCGACGG CGCTGCACTC GCATCTCAAG CGCCGTGGCG CCTATCTGGT CGGGCCGTTG 
GCGCGCTACG CGCTGAACTT CGACCGATTG CCGGAACATA TCCGGGCGCT CGCCGGCGAG 
GTCGGCCTCG GTCCGCTGTG CCGCAATCCG TTCCAGAGCA TCGTCGTGCG CGCCCTGGAA 
ATCCTCTACG CCTGCGAGGA GGCGCTGGCC ATCATCGCCG CCTACCGGCC GCCGGACATG 
GCCTGCGTGC CGCTGGAGCC ACGCGCCGCG ACAGGTTTTG GCTGCACCGA GGCGCCGCGC 
GGCACCCTCT GGCACCGTTA TGAACTGTCC GCCGACGGTT CCGTCGAGGC CGCGCGCATC 
GTCCCGCCCA CCGCGCAGAA CCAGCCGAGC ATCGAGGCGG ACCTGGAGGC GGTCGCCACG 
TCGCTGCTCG ACCAGCCGGA GGAGGTCATC CGTCGGCGCT GCGAGCTGAG CATCCGCAAC 
CACGACCCCT GCATCTCCTG CGCGACCCAC TTTCTCAAGC TGTCCGTGCA CCGCGCATGA

Protein sequence

MARVEGEGSL DLHIEGDRVV AARLGIFEPP RFFEAFLRGR GHAEVADMVA RICGICPVAY 
QMSAVHALEN AFGVRVEGQL RALRRLLYCG EWIESHALHV VMLHAPDFLG YPDAIRMAAG 
HGDRVRDALA LKKAGNSIIR LLGGREIHPV NVRVGGFYRV PSRAELAPLA EELDRARDIA 
VGLVRWVAGF PFPHIERDYE FVALRHPHEY PLNEGRLVSS RGLDIDIADY ETEFEERQVP 
HSTALHSHLK RRGAYLVGPL ARYALNFDRL PEHIRALAGE VGLGPLCRNP FQSIVVRALE 
ILYACEEALA IIAAYRPPDM ACVPLEPRAA TGFGCTEAPR GTLWHRYELS ADGSVEAARI 
VPPTAQNQPS IEADLEAVAT SLLDQPEEVI RRRCELSIRN HDPCISCATH FLKLSVHRA