Gene Aazo_4038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_4038
Symbol
ID	9341843
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	4097266
End bp	4098486
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	44%
IMG OID
Product	geranylgeranyl reductase
Protein accession	YP_003722626
Protein GI	298492449
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.670598
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGACACTAC GGGTTGCTGT TGTTGGTTCA GGCCCAGCTG GTTCATCTGC TGCTGAGACA 
TTAGCAAAAG CTGGGATTGA AACTTATTTA ATTGAGCGCA AGCTGGATAA CGCTAAGCCT 
TGCGGGGGTG CTATTCCCCT ATGTATGGTG AGTGAGTTTG ACCTACCTCC AGAGATTATC 
GACCGTCGAG TGCGGAAGAT GAAAATGATT TCTCCTTCTA ATCGTGAGGT AGATATCAAT 
CTGGTAAATG AAGAAGAATA TATAGGAATG TGCCGCCGTG AAGTATTGGA TGGATTCCTA 
CGCGAACGGG CGGCAAAACT AGGTGCTAAT TTAATTAACG CCACTGTTCA TAAACTTGAT 
ATACCCACAA ACAACACTGA CCCCTATACA ATCCATTACG TTGACCATAC AGAAGGTGGG 
GCACAAGGGA TTACGAAAAC ACTGAAGGTA GATTTAGTGA TTGGTGCTGA TGGGGCAAAT 
TCCCGCATTG CTAAAGAAAT GGATGCTGGG GATTACAATT ATGCGATCGC ATTCCAAGAA 
CGCATTCGTC TACCCCAAGA CAAAATGGCC TACTACAACG ACATGGCCGA AATGTATGTG 
GGTAATGACG TTTCTACCGA CTTCTATGCT TGGGTATTTC CCAAATATGA TCACGTAGCT 
GTTGGTACAG GAACAATGCA GGTTAATAAA GCCAACATCA AACAGTTACA AGCGGGTATT 
CGCGCCCGTG CTTCTAAAAA ATTAGCTGGT GGTCAAATTA TCAAAGTCGA AGCCCACCCC 
ATCCCTGAAC ATCCCCGTCC TCGTCGTGTA GTTGGACGTA TTGCGTTGGT AGGTGATGCT 
GCTGGTTATG TCACCAAGTC CTCTGGTGAA GGTATCTATT TCGCGGCTAA ATCTGGACGG 
ATGTGTGCAG AAACCATTGT GGAAGTTTCT AACAATGGTG TGCGTATTCC TACAGAAAAC 
GACTTGAAGA TTTACCTGAA GCGTTGGGAT AAGAAATACG GACTCACTTA CAAGGTATTG 
GATATTCTTC AAACCGTGTT CTATCGTTCC GATGCTACCC GTGAAGCATT TGTAGAAATG 
TGTGATGACA TGGATGTACA ACGGCTAACA TTTGATAGCT ATTTATACAA AACAGTAGTT 
CCAGCTAACC CCATCACTCA ACTCAAAATT ACTGCCAAAA CCATCGCTAG TTTATTACGC 
GGTAATGCCC TTGCACCTTA A

Protein sequence

MTLRVAVVGS GPAGSSAAET LAKAGIETYL IERKLDNAKP CGGAIPLCMV SEFDLPPEII 
DRRVRKMKMI SPSNREVDIN LVNEEEYIGM CRREVLDGFL RERAAKLGAN LINATVHKLD 
IPTNNTDPYT IHYVDHTEGG AQGITKTLKV DLVIGADGAN SRIAKEMDAG DYNYAIAFQE 
RIRLPQDKMA YYNDMAEMYV GNDVSTDFYA WVFPKYDHVA VGTGTMQVNK ANIKQLQAGI 
RARASKKLAG GQIIKVEAHP IPEHPRPRRV VGRIALVGDA AGYVTKSSGE GIYFAAKSGR 
MCAETIVEVS NNGVRIPTEN DLKIYLKRWD KKYGLTYKVL DILQTVFYRS DATREAFVEM 
CDDMDVQRLT FDSYLYKTVV PANPITQLKI TAKTIASLLR GNALAP