Gene Ava_1870 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_1870
Symbol	nusA
ID	3681822
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	2322023
End bp	2323300
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	46%
IMG OID	637717211
Product	transcription elongation factor NusA
Protein accession	YP_322387
Protein GI	75908091
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0338144
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAATGG TTAGTTTACC AGGATTAAAA GATTTAATAG AAAGTATTAG TCGTGAACGG 
AATTTGCCCC GGTTAGCGGT TCAAGCTGCT ATTAGAGAAG CCTTACTTAA GGGTTATGAG 
CGTTATCGTC GCGCTCAAAA CATCGAGCGC AAACAGTTTG ATGAAGATTA TTTTGATAAC 
TTTGAAGTCG AACTAGATAT TGACGAGGAA GGATTTCGCG TTCTTTCCAC AAAATCCATT 
GTTGAAGAAG TTAATAATTC TGACCATCAA ATCTCCTTAG ATGAAGTACA GCAAGTAGCT 
CCCGAAGCCC AATTGGGAGA CTCAGTGGTA CTAGATGTCA CCCCAGACCA AGGTGAATTT 
GGGCGCATGG CTGCCATGCA AACCAAGCAA GTACTGGCGC AAAAACTGCG GGATCAACAG 
CGCCAGATGG TGCAAGAAGA GTTCCAAGAC CTAGAAAGCA CAGTTCTCCA AGCCAGAGTT 
TTGCGATTTG AGCGCCAATC AGTCATTCTG GCAGTTAGCA GTACCTTTGG ACAACCAGAA 
GTAGAAGCCG AATTGCCCAA ACGCGAACAA TTGCCCAACG ACAATTATCG GGCAAATGCC 
ACATTTAAGG TTTATCTCAA AAAGGTTTCC CAAGGTCAGC AACGCGGCCC ACAGTTATTA 
GTCTCCCGTG CTGATGCAGG TTTAGTAGTT TATCTATTTG CCAACGAAGT ACCAGAAATT 
GAAGACGAAG TGGTACGGAT AGTTGCCGTA GCCAGGGAGG CAAACCCCCC TTCCCGCTAT 
GTAGGCCCAA GGACTAAAAT AGCAGTAGAT ACCCTGGATC GTGATGTAGA CCCCGTAGGG 
GCTTGTATTG GTGCTAGGGG ATCACGCATT CAGGTAGTAG TCAACGAATT ACGCGGCGAA 
AAAATTGACG TGATTCGCTG GTCTCCAGAC CCAGCAACAT ACATTGCTAA TGCCCTCAGT 
CCGGCGCGAG TCGATGAAGT GCGCCTCATG GACCCAGAAA CTAGACAAAC TCACGTATTA 
GTTGCGGAAG ACCAACTGAG TTTGGCTATC GGCAAAGAAG GACAAAACGT GCGATTAGCT 
GCCCGATTGA CTGGCTGGAA AATAGACATA AAAGATAAAG CCAAGTATGA CCAAGCAGCC 
GAAGATGCTA AATTTGTGGC GGCGCGTGCA AAATATCAAC TAGAGGAAGA TGACATCGAA 
TCAGAGGAGC TAGACTATGA AGAAAATCAA GAAGGAGAAT TAGAAGACGA GTCTTTTGAC 
CCCAACGATG AAGAGTAA

Protein sequence

MSMVSLPGLK DLIESISRER NLPRLAVQAA IREALLKGYE RYRRAQNIER KQFDEDYFDN 
FEVELDIDEE GFRVLSTKSI VEEVNNSDHQ ISLDEVQQVA PEAQLGDSVV LDVTPDQGEF 
GRMAAMQTKQ VLAQKLRDQQ RQMVQEEFQD LESTVLQARV LRFERQSVIL AVSSTFGQPE 
VEAELPKREQ LPNDNYRANA TFKVYLKKVS QGQQRGPQLL VSRADAGLVV YLFANEVPEI 
EDEVVRIVAV AREANPPSRY VGPRTKIAVD TLDRDVDPVG ACIGARGSRI QVVVNELRGE 
KIDVIRWSPD PATYIANALS PARVDEVRLM DPETRQTHVL VAEDQLSLAI GKEGQNVRLA 
ARLTGWKIDI KDKAKYDQAA EDAKFVAARA KYQLEEDDIE SEELDYEENQ EGELEDESFD 
PNDEE