Gene Aazo_0607 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_0607
Symbol
ID	9338394
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	637050
End bp	638435
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	38%
IMG OID
Product	S-layer domain-containing protein
Protein accession	YP_003720215
Protein GI	298490038
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGTCTTCTA AACGTCCAGC TATCTTTCTG AGTATGGCTG TTTTATTATC TTCCTTAACA 
GCCTGTTCTA ACAGTCCTGC ATCCAAAAAT TTGGAACAGT CTTTAGCAGC AGATCCCCTG 
CTGCAAAATA ACCCTACAGT TTTCGGACAA GCTAAGAATA AAGAAATCTC AACCACACCT 
ACAGTTCAGT TACCTACAGA TTTTCCTCAA GAAGTTCCTA TATATCCCAA TGCTACATTA 
CAAGAAGTCA AACCTGCTAA CAACTCAGAA AACTCAGAAC CAAAAACTAT AACTCGCTGG 
CAAAGTTCTG ACCCCACCAA TTTTATCACT AGCTTTTACC GAAGTCAGTT TCAAAACCAA 
AACTGGCAGA TTTTACAACA ACCAAAAGAT GATACGGAAG GTATTTTTGA AGTAAAGCAA 
AATAATTTAC TTTTAAAAGT AACAATTCGA CCAAAATCAG TTACTAACGT GACACCCAAT 
CAAGCTCAAA CTACAACTGA ATTATTAATT GAATACTTAG CTAATGAAAT TGCCATCAAT 
CAACCTACCA TTAATCAACC TGATTTAAAT CAAAATTCAA ATCCAAACTC CAGTGAAGTT 
GCCCAACCAC CTAATCCACA GTTTATTGGA CCTATCATAC CCAATGCAAA TGTAGTCCAA 
CAACCAGTTA TCCCAAAAAA CACATCTGAA CCTCAAGAAT TTAGTGACCT AAATCAAGCA 
CCAGCAGAAT GGCGAAAACA GATTCAAGAT TTGGCAACAT TGGGTGTATT GTCAATAGAA 
CCAGAGCAAA CTCAACCCAA CTCTAATTCT AGAAATAACC AATTCCAACC TAATAAAATC 
ATTACCCGCA GAGAATATGC TCGTTGGCTA GTTGCTGCTA ATAATACCAT GTATGCTAAT 
AATCCTGGTA AACAAATTCG TCTAGCATCA GGAAATGATC AACCTGCTTT TAGAGATGTT 
TTACCTAAAG ATCCTGATTT TCTCACAGTT CAAGGATTAG CAGAAGCAGG ATTAATTCCC 
AGTTCTTTAT CTGGAGATAC GACAGCAGTT TTATTTCGTC CTGATGCACC CCTAACAAGA 
GAACAATTGT TATTGTGGAA AGTCCCATTA GATACTCGTC AAGCCTTACC TGCTGCTAAC 
TTAGAAGCCG TCAAGCAAAC CTGGGGTTTC CAAGATACAG AAAAAATTGA CCCTAAAGCA 
CTAAGAGCAA TTTTGGCTGA TTTCCAAGGT GCTCAACAAT CAAATATTCG TCGGGTGTTT 
GGGTATACAA CATTATTTCA ACCCAAAAAA GCTGTAACTC GTGCTGAAGC TGGTGCGGCT 
TTGTCATATT TCGGTATTCA GAGTGAGGGA ATTTCAGCAA CCGAGGCTTT GAAATTAAAG 
GTGTAA

Protein sequence

MSSKRPAIFL SMAVLLSSLT ACSNSPASKN LEQSLAADPL LQNNPTVFGQ AKNKEISTTP 
TVQLPTDFPQ EVPIYPNATL QEVKPANNSE NSEPKTITRW QSSDPTNFIT SFYRSQFQNQ 
NWQILQQPKD DTEGIFEVKQ NNLLLKVTIR PKSVTNVTPN QAQTTTELLI EYLANEIAIN 
QPTINQPDLN QNSNPNSSEV AQPPNPQFIG PIIPNANVVQ QPVIPKNTSE PQEFSDLNQA 
PAEWRKQIQD LATLGVLSIE PEQTQPNSNS RNNQFQPNKI ITRREYARWL VAANNTMYAN 
NPGKQIRLAS GNDQPAFRDV LPKDPDFLTV QGLAEAGLIP SSLSGDTTAV LFRPDAPLTR 
EQLLLWKVPL DTRQALPAAN LEAVKQTWGF QDTEKIDPKA LRAILADFQG AQQSNIRRVF 
GYTTLFQPKK AVTRAEAGAA LSYFGIQSEG ISATEALKLK V