Gene Aazo_3865 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_3865
Symbol
ID	9341669
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	3917415
End bp	3919103
Gene Length	1689 bp
Protein Length	562 aa
Translation table	11
GC content	41%
IMG OID
Product	nickel-dependent hydrogenase large subunit
Protein accession	YP_003722499
Protein GI	298492322
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGGGGAAG ATAAGAGAAA TGAGGGAGAT GGGGAAGTAA TTTTCATAAT GCCCACCAAT 
TACCAATCAC CAATTACAAA TCACCCAGAA GTTATGCCAA TTCAAACCTT AGATATTTCA 
CCCGTTGGTA GAGTTGAAGG CGATTTAGAT GTGCGTGTCG AAATCGAAAA TGGATATGTC 
ACAAATGCCT GGACTCATGC CGAACTTTTT CGCGGTTTTG AAATCATTTT ACGCGGTAAA 
GACCCCCAAG CAGGTTTAAT TGTTACACCC CGAATTTGTG GAATTTGTGG TGGTTCTCAT 
CTCAGTTCTG CATCTTGGGC ATTAGATACT GCTTGGGGAA CAGAAATTCC TAGAAATGCT 
ATTTTGGCGA GAAATTTAGG TCAAATTGTC GAAACAATTC AAAGCATTCC CCGCTATTTT 
TATGGCTTGT TTGCTATTGA TTTAACTAAT AAAAATTATC GCCGTAGTCA TTTTTATGAT 
GAAGCCTGTC GGCGCTTTGC TGCTTTCACA GGTACATCCT ATGAAATTGG TCTGACAATT 
TCCGCCAAAC CTGTCGAAAT TTACGCTTTA TTAGGTGGTC AATGGCCGCA TTCTAGTTAC 
ATGGTTCCTG GTGGTGTAAT GTGCGCCCCC ACCTTAACTG ATATTACGCG CGCTTGGGCA 
ATTCTGGAAT ATTTCCGCAC CAATTGGTTA GAACCAGTTT GGTTAGGTTG TTCTTTAGAA 
AGATATGAAG AAATTCAATC TTATGAAGAA TTCCAAAAAT GGTTAAATGC TGATGTTAAA 
CATCGGGAAT CAGATTTAGG TTTATACTGG CGCATGGGTT TAGATATCGG TTTAGATCGA 
TATGGTGCTG GTGTGGGTAA GTATGTAACT TGGGGATATA TTCCCCATGA AGATAAATAC 
AATAAACCCA CCATTGATGG ACGTAACGCT GCTGTAATTA TGAAAAGTGG TGTTTACGAT 
AGCTTCACTG ATACCCATAC CTTGATGAAT CAATCATTTG CCCGTGAGAA TTTAACCCAT 
TCTTGGTATG ATGAAGGTAC AGAAGATTGG CATCCAAGTG ATCGCACTAC TTTACCTACT 
ATGAATAATA ATAAAGACTT TGGCGGTGCA TATTCCTGGG CACCTGCAGT CCTTCACCAA 
GACTTAGGAC GTTTAGAAGC CGGACCCCTA GCACGTCAGT TAGTTGCAGG TGGAAAACAT 
GGTGAATCTT GGCAACATTA CGACCCCTTC ATTCTTGATG TCTTCAAAAA AATGGGCGGT 
GCAAATGTTC ACGTTAGGCA AATAGCAAGA GTCCACGAAA TTGTTAAGTT ATATCGCCAA 
GCTGAACGCT GTTTACGGGA GTTTAAACTT AACGACCCTT GGTATATTAA ACCTAAAGAA 
AAAGATGGTA AAGGTTGGGG TGCAACTGAA GCTGCAAGAG GGGCATTATG TCACTGGGTA 
GAGATTGAAG ATAGCAAGAT TAAAAATTAC CAAGTTATTG CCCCGGGTAC ATGGAATATC 
GGACCCCGTG ACGGTGCAGG ACAACGAGGA CCCATAGAAC AAGCATTAAT AGGTACGCCT 
ATTGAAGATG CTAATGACCC CGTAGAAGTT GGTCATGTTG CGCGTTCTTT TGATTCTTGT 
TTGGTATGTA CTGTTCATGC CCATGATGCC AAAACTGGAG AAGAATTAGC ACGTTTTCGG 
ACAGCTTAA

Protein sequence

MGEDKRNEGD GEVIFIMPTN YQSPITNHPE VMPIQTLDIS PVGRVEGDLD VRVEIENGYV 
TNAWTHAELF RGFEIILRGK DPQAGLIVTP RICGICGGSH LSSASWALDT AWGTEIPRNA 
ILARNLGQIV ETIQSIPRYF YGLFAIDLTN KNYRRSHFYD EACRRFAAFT GTSYEIGLTI 
SAKPVEIYAL LGGQWPHSSY MVPGGVMCAP TLTDITRAWA ILEYFRTNWL EPVWLGCSLE 
RYEEIQSYEE FQKWLNADVK HRESDLGLYW RMGLDIGLDR YGAGVGKYVT WGYIPHEDKY 
NKPTIDGRNA AVIMKSGVYD SFTDTHTLMN QSFARENLTH SWYDEGTEDW HPSDRTTLPT 
MNNNKDFGGA YSWAPAVLHQ DLGRLEAGPL ARQLVAGGKH GESWQHYDPF ILDVFKKMGG 
ANVHVRQIAR VHEIVKLYRQ AERCLREFKL NDPWYIKPKE KDGKGWGATE AARGALCHWV 
EIEDSKIKNY QVIAPGTWNI GPRDGAGQRG PIEQALIGTP IEDANDPVEV GHVARSFDSC 
LVCTVHAHDA KTGEELARFR TA