Gene Aazo_2071 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_2071
Symbol
ID	9339865
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	2154299
End bp	2155483
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	44%
IMG OID
Product	4Fe-4S ferredoxin iron-sulfur-binding domain-containing protein
Protein accession	YP_003721242
Protein GI	298491065
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACTAATC TGTTAGCTTT ACAATCCCTA AAACAAGGTC ACTGGTTCAA GTTGATTTGT 
GGAGCCAGTT TCCAACATCT ACCTGCAGTT AGAAGTTTAA CCTTAGCCTA CACTTTGGCG 
GGTGCTGACT GCATAGACGT GGCAGCTGAT CCGGCGGTAG TTGTAGCCAC TCAAGCCGGT 
TTACAAGCAG CTAAGGATCT GGCTAGGGAA GCTCAAAAGC AAGGCTTTGG TTTTAAAGGT 
GATTTGCCTT TACTCATGGT CAGCCTCAAC GACGGAGAAG ATCCGCATTT TAGAAAAGCA 
GAATTTAATG CTAGTAGTTG TCCGGTAGAT TGCCCTAGAC CCTGTGAAAA AATTTGTCCA 
GCACAAGCTA TTGTGTTTAA CAATATAAAA GATAGCTTTT CAGGAATTAT TGCTGAAAAA 
TGTTATGGCT GCGGTCGTTG CATTCCAGTT TGTCCTTATG AGATGATAAA TACAACATCT 
TATATATCAA CTCCGGAAGC TATAGCACCA TTGATCATGT CAAAGGGAAT AGATGCCATA 
GAAATTCATA CAAAAGTAGG GCGTTTGGCA GAATTCCAGC GTTTGTGGGT AGCGATCGCT 
CCTTGGGCAG ATAAATTAAA GTTAATAGCT ATCAGCTGTA ACGATGGTAA AGGGCTGATT 
GATTATCTCC AAGCAATTTA TGACCTGATC ATCCCCCATC CCGAAATTCT AATTTGGCAA 
ACAGACGGGC GCTCTATGAG TGGTGATATC GGCAATGGCA CTACTATAGC AGGAATCAAA 
CTAGGGCAAA AAGTTTTGGC AGCAAATCTA CCAGGATATG TGCAGTTAGC AGGGGGTACT 
AATAGCTACA CTGTTCCTAA ATTAAAGTCC ATTGGATTGC TGAAAGAGTC AGGGGAGCAT 
GGAGCGGGGG GTAGGGAGCA GCGGGCAGGG AGTAGCCAAC AGGGAGCAGC CGACAAGGGG 
GAAAATACCT CTCCTCTCCA ACGCCAGTCG CCTGCCTTTA TCTCCGGTGT TGCTTACGGT 
AGCTATGCCC GTGTATTGCT GTCACCGATT CTTGAACAGT TAGAAAATAA AGAGGTAATT 
ACCACCAGTG TTAAAGCAAA TCTACGCCTC GAAGATGAAC CAGAACTACT ATGGCAAGCT 
GTGAAACTTG CTCATTCTCT CGTTTCCCAG ATTAAGTCAC AGTAA

Protein sequence

MTNLLALQSL KQGHWFKLIC GASFQHLPAV RSLTLAYTLA GADCIDVAAD PAVVVATQAG 
LQAAKDLARE AQKQGFGFKG DLPLLMVSLN DGEDPHFRKA EFNASSCPVD CPRPCEKICP 
AQAIVFNNIK DSFSGIIAEK CYGCGRCIPV CPYEMINTTS YISTPEAIAP LIMSKGIDAI 
EIHTKVGRLA EFQRLWVAIA PWADKLKLIA ISCNDGKGLI DYLQAIYDLI IPHPEILIWQ 
TDGRSMSGDI GNGTTIAGIK LGQKVLAANL PGYVQLAGGT NSYTVPKLKS IGLLKESGEH 
GAGGREQRAG SSQQGAADKG ENTSPLQRQS PAFISGVAYG SYARVLLSPI LEQLENKEVI 
TTSVKANLRL EDEPELLWQA VKLAHSLVSQ IKSQ