Gene Aazo_0404 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_0404
Symbol
ID	9338188
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	405667
End bp	406803
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	44%
IMG OID
Product	2-methylcitrate synthase/citrate synthase II
Protein accession	YP_003720084
Protein GI	298489907
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGGTGT GCGAATACAA GCCTGGTTTA GAAGGCATTC CCGCAGCCCA ATCGAGTATT 
AGTTATGTAG ATGGGCAAAA GGGAATACTG GAGTATCGTG GCATTCGGAT TGAGGAATTA 
GCAGAAAGAA GTACATTCTT AGAAACTGCT TATCTCTTAA TCTGGGGTGA ATTGCCAAAC 
AAGGAAGAAT TGGCGGCTTT TGAAGATGAA GTTTGTACCC ACAGGCGGAT AAAATACCGC 
ATTCGGGATA TGATGAAATG CTTCCCCGAA AGCGGTCATC CAATGGATGC TCTACAAGCC 
TCTGCTGCTG CCTTGGGTTT ATTTTATTCT CGTCGTGACT TACATAACCC TGTCTATATT 
CGGAATGCAG TAGTACGTTT AGTAGCGATA ATTCCCACAA TGGTAGCGGC TTTCCAGTTG 
ATGCGGAAGG GTAATGATCC GGTAAAACCA AGGGATGATT TGGATTATGC CGCCAACTTC 
TTGTATATGC TCAATGAGAA AGAACCCGAT CCGTTAGCAG CGCGAATTTT TGACATCTGT 
TTGATTCTGC ACGTTGAGCA TACAATGAAT GCTTCTACCT TCAGTGCGAG AGTTACAGCT 
TCTACCTTAA CTGACCCTTA TGCTGTGGTT GCCAGTGCGG TAGGTACTTT AGGCGGTCCG 
CTGCATGGTG GTGCTAACGA AGAAGTTATT GAGATGTTGG AAGAAATTAG CTGTGTGGAT 
AATGTCCGTT CCTACATAGA AGATCGTCTG CAAAAGAAGG CGAAAATTAT GGGGTTTGGA 
CACCGTGTAT ATAAGGTAAA AGATCCACGG GCAACTATCT TACAACGATT GGCAGAGCAA 
CTGTTCGATA AGTTTGGCTA CGATAAGTAT TATGAAGTTG CTCAAGAAGT AGAATGGGTA 
ATGGCCGAGA AAGTCGGCAG CAAAGGGATT TATCCTAATG TTGACTTTTA CTCTGGGCTC 
GTGTATAGGA AAATGGGAAT TCCCACGGAT TTATTTACAC CTGTATTTGC GATCGCTCGT 
GTGGCTGGTT GGTTAGCACA CTGGAAAGAA CAACTTGCAG AAAACCGGAT TTTCCGTCCT 
ACCCAAGTTT ATAACGGTCG TCACGAAATC ACTTACACTC CCATCGACAA GCGTTAA

Protein sequence

MTVCEYKPGL EGIPAAQSSI SYVDGQKGIL EYRGIRIEEL AERSTFLETA YLLIWGELPN 
KEELAAFEDE VCTHRRIKYR IRDMMKCFPE SGHPMDALQA SAAALGLFYS RRDLHNPVYI 
RNAVVRLVAI IPTMVAAFQL MRKGNDPVKP RDDLDYAANF LYMLNEKEPD PLAARIFDIC 
LILHVEHTMN ASTFSARVTA STLTDPYAVV ASAVGTLGGP LHGGANEEVI EMLEEISCVD 
NVRSYIEDRL QKKAKIMGFG HRVYKVKDPR ATILQRLAEQ LFDKFGYDKY YEVAQEVEWV 
MAEKVGSKGI YPNVDFYSGL VYRKMGIPTD LFTPVFAIAR VAGWLAHWKE QLAENRIFRP 
TQVYNGRHEI TYTPIDKR