Gene Aazo_3853 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_3853
Symbol
ID	9341658
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	3905669
End bp	3906802
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	45%
IMG OID
Product	XRE family molybdate metabolism transcriptional regulator
Protein accession	YP_003722489
Protein GI	298492312
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.593506
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCAGG AGAACCACCT CCGTAATAAC TTGAAGTCTA TTAGAACTCG CTTGGGTATG 
AGCCAGCAGG AATTGGCAAA TCTTGCTGCT GTAACTCGTC AAACTATTAG TGGTGTTGAA 
TCAGGGCTAT ATGCTCCTTC TGTAGCGATT TCATTGCGCC TAGCTAAAGC TCTTGGTTGT 
CAAGTGGAGG AACTATTCTG GCTAGAGCAC GATTTACCTC AAATCGAAGC GGTGCTTACC 
AAACCTGTTA ACAACCTCCA ACAATTAAGA GTGAGTTTAG CGCGAGTGGG AGGTCAATGG 
ATAGCTTATC CATTGGTTGG TAAGGATGCT TTTCGTCAAG ATATGATTCC TGCTGATGGT 
GAAGGTGAGA GGCTGACAGA TAGCAATAAG CTGAATGTCC GTCTGCTCGA TGATAATATG 
GACAGGCTTT ATAACACAGT TGTAATTGCT GGGTGTTCGC CTGTGATTTC CCTCTGGGCT 
AGAAGTACAG AACGGTGGCA TCCTCAACTT CGGGTACAAT ACAACTTTGC TAATAGTATG 
AGGGCATTGC ACAGTTTATG CAGAGGTGAG ACGCATATTG CCGGGATGCA TTTATATGAT 
GTGGAAACGG GAGAATATAA CACTCCGTTT GTGCGGAAGG TGCTGGTGGG AAAGGAAGCA 
GTAATCATCA CTCTCGGAGT TTGGGAAGAA GGGTTGATGG TACAAGCTGG GAATCCAAAG 
CAAATTAAAA GTATCACTGA TGTAGTGGAG ATGGGTGCAG CGATCGCCAA TCGTGAGGTG 
GGTTCTGGTA GCCGATCGCT ATTAGAGCAA ACTTTACAAC AGGAGAAAAT ACCATTCCAA 
TCACTGCAAG GGTTTGAGTG GATTATGAAT AGTCATCAAG AGGTGGGATG GGCGATCGCA 
TCTGACATGG TGGATGCTGG TATTAGTACA GCCTCTGTTG CCATTGCCTT TGGACTAGGA 
TTTGTCCCCC TACGTCGGTC ACGATATGAT TTAGTCATTC TGAAAGAATA TATGCAAGAG 
CCACCTGTAC AACAATTACT GAGTACTCTC GGACATCGGC TGGTTCACTC ACAATTACAA 
ATCCTCGGTG GGTATGATAT TAGCCAAATC GGCGCAGTTG TGGCCACAAT TTAA

Protein sequence

MKQENHLRNN LKSIRTRLGM SQQELANLAA VTRQTISGVE SGLYAPSVAI SLRLAKALGC 
QVEELFWLEH DLPQIEAVLT KPVNNLQQLR VSLARVGGQW IAYPLVGKDA FRQDMIPADG 
EGERLTDSNK LNVRLLDDNM DRLYNTVVIA GCSPVISLWA RSTERWHPQL RVQYNFANSM 
RALHSLCRGE THIAGMHLYD VETGEYNTPF VRKVLVGKEA VIITLGVWEE GLMVQAGNPK 
QIKSITDVVE MGAAIANREV GSGSRSLLEQ TLQQEKIPFQ SLQGFEWIMN SHQEVGWAIA 
SDMVDAGIST ASVAIAFGLG FVPLRRSRYD LVILKEYMQE PPVQQLLSTL GHRLVHSQLQ 
ILGGYDISQI GAVVATI