Gene Aazo_4900 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_4900
Symbol
ID	9342707
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	5013188
End bp	5014438
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	42%
IMG OID
Product	competence/damage-inducible protein CinA
Protein accession	YP_003723159
Protein GI	298492982
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGCAG AAATTATTTG TGTCGGTACT GAATTGCTAC TAGGAGATAT CCTTAACAGC 
AATGCCAAAT TTCTTGCCCA GCAGTTAGCA CAACTAGGAA TTCCGCACTA CTATCAAACA 
GTAGTTGGGG ATAATCCCGA ACGAATTAAG CAAGTTATCG AAATTGCTGC TTCCAGAGTG 
CAAATTCTCA TTTTCACTGG TGGTCTTGGC CCTACACCTG ATGACCTCAC CTGTGAAACC 
ATTGCTGATT TTTTTGGTGT TCCTTTGGTT GAAAACGCCG CAATTATTGA AGATATAAGT 
GAGAAATTTA CCCAACGTGG TCGGGTAATG TCTCCTAGTA ACCGTAAACA AGCATTAATT 
CCCCAAGGTG CAGAAATTTT ACCCAACCCT ACAGGAACAG CACCAGGTAT TATTTGGCAA 
CCCCGACCTG GATTAACAAT TCTTACCTTC CCTGGTGTTC CCAGCGAAAT GCACCGAATG 
TGGTCAGAAA CAGCAGTACC TTTTCTGAAA AGTCAAGGTT GGGGCAAGGA AATTATTTAC 
AGTCGGAGTT TAAAATTTTG GGGTATTGGT GAATCTATTT TAGCAGAAAA GGTATCTGCT 
TATCTGAATT TACCTAACCC GACAGTCGCC CCTTATGCGG GTAATGGAGA AGTCAGGCTA 
CGAATTTCTG CTAAAGCATC TGACTCAACA GCCTCAGCAG ATTTAATTTC ACCAATTGAA 
AAACAACTTC GGGAAATAGG TGGATTAGAT TGTTACGGTG CTGATGATGA TACTTTAGCT 
TCTGTTGTTG GTGACTTATT GCGGTCATCA GGGGAAACTT TATCAGTAGC AGAATCTTGC 
ACTGGTGGTG GACTGGGGCA AATGTTGACG GAAATTTCTG GTAGTTCTGA TTACTTTTTG 
GGTGGAGTAA TTTCTTATGA CAATTCGGTA AAAGTTGGTT TATTGGGAGT TAACCCAGAA 
GATTTAGATA AGTTTGGGGC AGTAAGTGCT ACTGTAGCAG AACAAATGGC TGTGGGTGTA 
AAAGGTCGTC TCTTCACCAC TTGGGGATTA AGTATTACGG GAATTGCTGG TCCGACTGGG 
GGAAATGTGG CTAAACCAGT GGGGTTAGTA TATATTGGTT TAGCTGGCTC AGGAGATGAA 
GTGAAAAGTT ATGAGTGCAG ATTTGGGGCA ATGTGGCATC GATCGTTTAT TCGTTATATG 
AGTGCCTGTC AGGCTTTGGA TAATTTACGA CGTAGTTTAT TGAAGCGTTA G

Protein sequence

MSAEIICVGT ELLLGDILNS NAKFLAQQLA QLGIPHYYQT VVGDNPERIK QVIEIAASRV 
QILIFTGGLG PTPDDLTCET IADFFGVPLV ENAAIIEDIS EKFTQRGRVM SPSNRKQALI 
PQGAEILPNP TGTAPGIIWQ PRPGLTILTF PGVPSEMHRM WSETAVPFLK SQGWGKEIIY 
SRSLKFWGIG ESILAEKVSA YLNLPNPTVA PYAGNGEVRL RISAKASDST ASADLISPIE 
KQLREIGGLD CYGADDDTLA SVVGDLLRSS GETLSVAESC TGGGLGQMLT EISGSSDYFL 
GGVISYDNSV KVGLLGVNPE DLDKFGAVSA TVAEQMAVGV KGRLFTTWGL SITGIAGPTG 
GNVAKPVGLV YIGLAGSGDE VKSYECRFGA MWHRSFIRYM SACQALDNLR RSLLKR