Gene Aazo_0189 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_0189
Symbol
ID	9337974
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	179738
End bp	181084
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	42%
IMG OID
Product	pentapeptide repeat-containing protein
Protein accession	YP_003719938
Protein GI	298489761
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.130578
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGATTG CATCTAATTC TTCTCATCCA CCAAAGCCAG AAACGAATAT AGATAAAGAC 
TTGCAGCCAG ATGATTTTGA TGCAAGTGAA AATGGACTAA CTTCAGAAGG TTTGGCCGCA 
CAACAAGCCT TATCAGCAAT TTCTTCTTTA CAATCTCCCC AACATACAAA TGCTCTCAAA 
CAAGCGACAT CTGGTTTTAA AGACATTTCT CATCATCAAC TTGCTGTCAA GCCTAGAGCA 
TTATTATTTA CTCTACTAGC GATCGCACTC ACTTTTATTG GTATTGCTAT TAATAACTCC 
TTTCTGGGCA TTTTAGGAAC TCTCACAACT TTGGTGTTAT CTGTGGCTAT ACTTTTACCT 
TGGTTGCAAG ACGTCGTTCA AGAATGGTTT TCTGCCCAAG AAAGAACAGT TTTGGTGGGT 
TTGACGGGCT TATTAGTAGC AATTTGTGGC TTATTCAGGT TTACTGGTGT CGAAAATGGA 
CTACTCCGCT GGGGAAGCAA GATTAACTGG GATATTGCGG GTACTTTAGC AGATTGGTTT 
GGCGCTTTAG GGCAAATTTC CATAGCTATC ATCGCTGTTT ACGTAGCTTG GCGACAATAT 
GTAATTTCTA AAGACTTAAC TATTCAACAA AACCTGCTGA CAGTACAACA AAATATTATT 
ACCCAACAGC AAACAATAGA TTCTTATTTC CAAGGTGTTT CTGACTTGGT ACTGGACGAA 
GAGGGATTAT TAGAAGACTG GCCACAAGAA AGAGCGATCG CAGAAGGACG AACTGCCGCA 
ATTTTTAGTA GTGTAGATGG TAGTGGTAAA GCCAAAATTC TCCGTTTTCT CTCCCGTTCA 
AAATTACTCA CACCATTAAA ACGCGATCGT CGTTTAGGTA GAGCGATTCT TGACGGTATC 
GGTGGCTACG CAGAAGACCT TTTAGAAGGT GTGCGCGTCA TTGACTTAGG TGTAATGTTA 
GCAGGTGCAG ACCTGTCGAA CACTGATTTA CGCTGGACTG ATTTAAGCGA AGCGAATCTT 
GTCCGTGCTA ATCTCAGCGG TTGTGATTTA GTCAAAGCCA ACCTATCCCG CACTATCTTA 
TATGATGCGG ATCTCAACAA TAGCGATTTA AATGGAGTGC GTTTCTTTTA TGGTTCATTA 
GAAAAAGCCT CACCCCGCAG TCGCAACAAC CCACCCAACT ATGAAACAGG GGAACACACC 
GGCGCAGTTG TGGAAAATGC CGATTTCAGA AACGCACAAC GGATGTCCGA ATCAACCCGT 
CAATACTGCT GTGCTTGGTG TGGAGAAGAA GCCAGACGGA CTATTCCTGG TGGTTGTGAA 
GGTATTCCCA ATAAATTGGG TAGATAA

Protein sequence

MTIASNSSHP PKPETNIDKD LQPDDFDASE NGLTSEGLAA QQALSAISSL QSPQHTNALK 
QATSGFKDIS HHQLAVKPRA LLFTLLAIAL TFIGIAINNS FLGILGTLTT LVLSVAILLP 
WLQDVVQEWF SAQERTVLVG LTGLLVAICG LFRFTGVENG LLRWGSKINW DIAGTLADWF 
GALGQISIAI IAVYVAWRQY VISKDLTIQQ NLLTVQQNII TQQQTIDSYF QGVSDLVLDE 
EGLLEDWPQE RAIAEGRTAA IFSSVDGSGK AKILRFLSRS KLLTPLKRDR RLGRAILDGI 
GGYAEDLLEG VRVIDLGVML AGADLSNTDL RWTDLSEANL VRANLSGCDL VKANLSRTIL 
YDADLNNSDL NGVRFFYGSL EKASPRSRNN PPNYETGEHT GAVVENADFR NAQRMSESTR 
QYCCAWCGEE ARRTIPGGCE GIPNKLGR