Gene Aazo_2421 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_2421
Symbol
ID	9340220
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	2518714
End bp	2519934
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	45%
IMG OID
Product	hypothetical protein
Protein accession	YP_003721473
Protein GI	298491296
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.762452
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATACAAG AACCCAGCAC CCATCTAATT ATTTCCGAAG CAGTAGAGGA CTTAATCCCT 
AAGGAAACCC TGTCGATAGA GACTTACGCT GAAGGCTTAA TGGATGATCT CTTCACCGAG 
ATCGACAACA TTCTGGAGGG TCGTAGAAAA CGTCCTAACA AAGCTGTGAG GGCAGAGTAC 
ATACCCATGC AAACAGTGAC GATGAAAATA CCAGAAGTGG TTTTGCCACA AACAGTACAT 
CGCGCAGTTC AAGCAATGTC GTCAAGCAAA AACGAGCAAA CGAGTACACT GGTATTCAAT 
TCTGCTTCTG TAACTGCAAT TACTAAAAGG ACTGAACAAC ACCGTGGTAG TTTAACTAAC 
CTGCTAATTC TGGGAGCAAC CTTAAGTGCA GCAATGGTGG GTACACTTTA TTTAACAGAG 
TCGGGATTAC TCACAAATAT TACCGCTAAA ATAATTCCGC AGACGCTACA AACAAGCCAG 
CTACAATCGC CCGTCCTCCT ACCACCAGAT CCTCTAGGGG AATTGGTGAA TTATATGCTG 
GAAGCCTTGG CTGTCATTGA CCAGCAAAGC AACACTCCCA CACAGGCTAA ATCTGGTTTC 
CCTGATGTCA ACCTCAGCCA GTCCAACTCC TTAGCCTTGG CGAACACCCA ACCTGTTGGT 
ACTTTACCTC CACCAGTTGC AGCGGACAAT GTATCAATTG TTCCCAGTCG GGTAAGAAAT 
GTTATCGAAC GGGTATATGT CCCTGTTTAC CAAGCACCTC CACTTATAAA CCCATTACCA 
CAAGTACCAT CGTTGCCAGG GCAGGTTTCT CTACCTCAGT CTGTACAAGA TACACCCCAA 
AATGTGCAAG CAGAGGCAAA GCCAATACCG GAAAAAATGT CACCAGCAAC TGTAAAACAA 
GCAGTTAATC CCCTCCCAAC CCGCATAGCA CCACCAAAAC TACCTACTGC GACAATAACT 
ATACCAGCAG CCAAGCCTGA AGCAGCATCA ACTACAGTCC AGCAGGTTTA TTTACCTGCC 
TATTCCGCAG AGTTAGAGGG ATTGTTAGAG TTAGGTAAAA AGTCTGCGGC TTTATTTAAA 
GTTGATGGTG TGACTCGTCG TATTAATTTA GGACAGAGTA TTGGTCCCAG TGGCTGGACA 
TTGGTAGAGG TGAGTAATGG TGAAGCAATT ATCCGCCGTA ATGGTGAGGT ACGCTCAATT 
TATACTGGTC AAAAACTGTA A

Protein sequence

MIQEPSTHLI ISEAVEDLIP KETLSIETYA EGLMDDLFTE IDNILEGRRK RPNKAVRAEY 
IPMQTVTMKI PEVVLPQTVH RAVQAMSSSK NEQTSTLVFN SASVTAITKR TEQHRGSLTN 
LLILGATLSA AMVGTLYLTE SGLLTNITAK IIPQTLQTSQ LQSPVLLPPD PLGELVNYML 
EALAVIDQQS NTPTQAKSGF PDVNLSQSNS LALANTQPVG TLPPPVAADN VSIVPSRVRN 
VIERVYVPVY QAPPLINPLP QVPSLPGQVS LPQSVQDTPQ NVQAEAKPIP EKMSPATVKQ 
AVNPLPTRIA PPKLPTATIT IPAAKPEAAS TTVQQVYLPA YSAELEGLLE LGKKSAALFK 
VDGVTRRINL GQSIGPSGWT LVEVSNGEAI IRRNGEVRSI YTGQKL