Gene Aazo_3223 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_3223
Symbol
ID	9341027
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	3315395
End bp	3316810
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	41%
IMG OID
Product	cell envelope-like transcriptional attenuator
Protein accession	YP_003722054
Protein GI	298491877
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACTAGTC AAAGAACATC AGCAGAAAAT AATAAATCAG CAAAAGCGAA AACCAGAAGT 
AAAACCTCTC GTAAATCAAA ATCAGGGCGT TGGCTATGGT TTGTGGTGGG TATGGGTGGG 
ATTGCAATGG TTTCAGGTAT GGCGGGAGCT TTGTTGGCAG TTTCTTGGGA CAGTACACCT 
TTGCAGCAAG AGCAGTTGAG TGCCAAGGAT GCAGCAGTTT TTGACGGTGA TCGCATTTCG 
GGAAATGGAT TGCAATTTTC CCAATTAACT CGCCCAGTGA ATATCTTAGT TATGGGCATG 
AGTGTACTGC CACCAGATGT TCAAAACCAA CCCAGTGATA CCAAAGAACT TAAATATCTA 
CCCCAGATCA ATTCTTTTGA TGGTCTCTCT GACGTGATGC TCTTAATCAA ATTTGATCCA 
GAGACAAAAA AAATTGTCAT GCTTTCTATT CCTAGAGATA CTCGTGCAGA AATAGAAGGG 
TTTGGTGCCA AAAAAATTAA CGCCGCCAAT GTCGATGGTG GACCAGCTTT AACTGCTAAA 
GCCGTCAGTA ATCTCTTGGG TCGAGTGGGA ATTGACCGTT ATGTCCGCAT TAATGTCCTG 
GGGGTTGCCA AGCTGATAGA TGTTTTGGGT GGGGTAACAG TTTACGTTCC CAAAGATATG 
AAATATCAGG ATGATTCACA GCATTTATAT ATTAATTTAA AGGCAGGTAA ACAGCATCTT 
AAAGGTGAAC AAGCCTTACA GTTGCTGCGT TTTCGCCATG ATGAACTAGG TGATATTGGA 
AGAATTCAGC GTCAGCAAAT GGTCTTGCGT TCTTTGATTG AACAAACTCT CAATCCCTCA 
ACATTAACGC AATTGCCCCA AATTTTGAAT GTAGTTAAAG ATAATATCGA CACTAATTTA 
ACAGTTGAAG AATTAGTTGC GTTAGTTGGT TTTGGTTCAC GAACTAATCG TTCTAATATG 
CAGATGTTGA TGTTGCCTGG ACGCTTTAGT GGAAAGAGTG AGTATGATGC CAGTTATTGG 
ATACCCCAGA AACGAGCAAT CAACAAATTA ATGGTTCAGA ATTTTGGTTT AGAATCAGAA 
TTATTAGACA CTGAAACAAT AGACCTTGGT GCATTGCGAG TAGCGATTCA AGATAGCACA 
GGTGGCGATC ACTCTCAAAT CCGTCCCCTA ATTATAGCCT TGGAAAAAGC CGGATATCGC 
AACATCTTTA TCTCTAAACC ATGGGGTGAA CCTCTGGAAA TTACCCATAT CGTCGCCCAA 
CAAGGAGACA GTGAAAGCGC CGAATCAATT CGTAATACTT TAGGATTTGG CGAAGTGCGA 
GTAGAAAGCA CAGGTAATAT CGGTTCAGAT ATCAGCATCC AAGTCGGTAA AGATTGGTTA 
GAAAAGAAGG CAACTTTTGA AGCCTATAGT AGGTAA

Protein sequence

MTSQRTSAEN NKSAKAKTRS KTSRKSKSGR WLWFVVGMGG IAMVSGMAGA LLAVSWDSTP 
LQQEQLSAKD AAVFDGDRIS GNGLQFSQLT RPVNILVMGM SVLPPDVQNQ PSDTKELKYL 
PQINSFDGLS DVMLLIKFDP ETKKIVMLSI PRDTRAEIEG FGAKKINAAN VDGGPALTAK 
AVSNLLGRVG IDRYVRINVL GVAKLIDVLG GVTVYVPKDM KYQDDSQHLY INLKAGKQHL 
KGEQALQLLR FRHDELGDIG RIQRQQMVLR SLIEQTLNPS TLTQLPQILN VVKDNIDTNL 
TVEELVALVG FGSRTNRSNM QMLMLPGRFS GKSEYDASYW IPQKRAINKL MVQNFGLESE 
LLDTETIDLG ALRVAIQDST GGDHSQIRPL IIALEKAGYR NIFISKPWGE PLEITHIVAQ 
QGDSESAESI RNTLGFGEVR VESTGNIGSD ISIQVGKDWL EKKATFEAYS R