Gene Aazo_1100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_1100
Symbol
ID	9338896
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	1184324
End bp	1185805
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	41%
IMG OID
Product	pentapeptide repeat-containing protein
Protein accession	YP_003720573
Protein GI	298490396
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.257041
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGCTA AAAAGACAGA TGCAACATTA CATTGGTTGC TCACCATCAT CCTTATTGTT 
GCTCTGTCCT TAATACTGAT TGTCTTCGCA TCTACTAATA TTGAGAAGTT ATCACTTCAG 
CAGCGAATAG CTAACAAAAA CCAAGCATTA ACCACCACTG CTATAGTCTT TCTGGGTTTA 
GCTGTTGCAC TTAATGCTTA TTACGCAGCC AAGCGGAATC AAGTCATGGA AAGAAATGCT 
ATTACGGCGG AGAAAACTCT GGCAATTGGC ATTGAAAATA CTAAACTCAC CCAAGACAAA 
CTCATTGCAG AACGATTTAT TGGCTCTATT GCTCAGTTAG GACATGAAAA GGTAGAAACG 
CGCATAGGTG CTATTTATGC CTTGGAAAGA ATTGCCCAGG ATTTCCCTCA AGAACACTGG 
ACAATTATGG AAATTCTCAC TGCTTTTGTT CGTGAAAATG CACCTGTACA ACCGGAGCGA 
AAGCCACAAA AACCAGAAGA TATCATGGCG ATTGATTTCG GGAAAAATCG TGACAGAGTG 
CGTCGTCAAC AATCAGTAGA TTATTCTCTC TCATGGGAAT CTTTTAAACT TCGTACTGAT 
ATTCAAGCTG CTTTGACTGT CATCGGTAGA CGCAATTTTC AACAAGACCG AGAAAATCAA 
AAACTGGATT TACGCAATAC TGACATCAGA CGAGTAGACT TAGCAGGAGG TAAACTACAA 
AGAGTGGATT TGCGCGGATC TGATTTGTGT GGTGCAGACT TGCGGGAAGT TGATTTAAGT 
GAAGCAGACT TGGATGGTGC AAAACTTATT GGTTCGATTC TTTATGAAGC CAACTTATTT 
AAAGCGAGTT TACGGGGAGT TAATTTGAAT CGGGCAAATC TGAATCTCGC TAATTTATAT 
GGAGTAAACC TACGTTCAGC TAATTTGTGT GGTGCAAGTT TGCGTTCAGC TAATTTACAA 
GCTGCTAACT TGTATAAAGC CAATTTGCAA CAAGCAACTC TCAAAGCTGC TAATTTGTCT 
GGTGCTAAGT TATTTTTAGC TAACTTGCAA GGGGCGAAAT TGGGTAAAAC TAATTTAAGT 
TCAGCCGGCT TGACTGCTGC GAATCTGGAA GGTGCAAATC TCAATGGTGC CAATCTGCAA 
GGTGCAAATT TAAACGCTGC AAAATTACAG CAAACGGATA TCTATTTTGC TAATCTCAGT 
GAGGCTAGTT TGACAGAAGC AGATCTACAT AATGCTAATT TGATGGGAGC AAATCTTTCT 
CTAGCAACGC TTGATGAAGC TGATCTGTCC TGGGCTAATT TGATGGGGGC TAACTTATCA 
GGCGCTCATC TTTGTGATGT TAAACTGACT GGAGCGATTT TAACTGGGGC GAAAAACCTG 
GAATCTGAGC AGATAGTTAT GGCGTTAGGC GATTGGACTA CTCGTCTGCC TGATTATATC 
GATTATATCG AAGCGCCAGC CAGTTGGCTA CAATCTGTTT AA

Protein sequence

MSAKKTDATL HWLLTIILIV ALSLILIVFA STNIEKLSLQ QRIANKNQAL TTTAIVFLGL 
AVALNAYYAA KRNQVMERNA ITAEKTLAIG IENTKLTQDK LIAERFIGSI AQLGHEKVET 
RIGAIYALER IAQDFPQEHW TIMEILTAFV RENAPVQPER KPQKPEDIMA IDFGKNRDRV 
RRQQSVDYSL SWESFKLRTD IQAALTVIGR RNFQQDRENQ KLDLRNTDIR RVDLAGGKLQ 
RVDLRGSDLC GADLREVDLS EADLDGAKLI GSILYEANLF KASLRGVNLN RANLNLANLY 
GVNLRSANLC GASLRSANLQ AANLYKANLQ QATLKAANLS GAKLFLANLQ GAKLGKTNLS 
SAGLTAANLE GANLNGANLQ GANLNAAKLQ QTDIYFANLS EASLTEADLH NANLMGANLS 
LATLDEADLS WANLMGANLS GAHLCDVKLT GAILTGAKNL ESEQIVMALG DWTTRLPDYI 
DYIEAPASWL QSV