Gene Cyan7425_2089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan7425_2089
Symbol	nusA
ID	7288015
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 7425
Kingdom	Bacteria
Replicon accession	NC_011884
Strand	+
Start bp	1978540
End bp	1979781
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	53%
IMG OID	643585085
Product	transcription elongation factor NusA
Protein accession	YP_002482813
Protein GI	220907502
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.69598
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAATGG TTCGTTTGCC CGGTCTACGC GAAATGATTA ATGCCATCAG CCGGGAACGG 
AATTTGCCCA AATATGCAGT GCAGGGGGCC TTGCAGGAAG CACTGATGAA AGGCTATGAG 
CGGTATCGTC GCACCCTGCG CCTGGAGGGC GGACACTTTG ATGAAGATTA CTTCCAGAAT 
TTTGACGTAG AAATTGATGT GGAAGAGGAA GGGTTCCGGG TTCTGGCCAC CAAAACGATT 
GTGGAGCAGG TAGACAACCC GGATCATCAG ATTTCCCTAT CTGAAGTGCA GGAAGTTGCA 
GCAGAAGCTC AATTGGGAGA TACCGTGATT CTGGATGTTA CCCCAGAACA GCAGGAGTTT 
GGGCGCATGG CAGCAATTCA AGCCAAACAA GTTTTAGCTC AAAAACTGCG GGATCAACAG 
CGGAAACTGG TGCAAGAAGA ATTCCAGGAT CTGGAAAGTA CGGTGTTGCA GGCTCGGGTG 
CTGCGGTTTG AACGACGTTC CGTGATCATG GCGGTGAGCA GCGGCTTTGG TCAACCTGAG 
GTCGAGGCGG AATTGCCGAA AAAAGAGCAG CTACCCAATG ATAATTATCG CGCTAATGCC 
ACATTTAAGG TTTATCTGAA AAAGGTTTTG GAAGGGCCAC ACCGGGGACC CCAATTGCTG 
GTTTCCCGGG CGGATGCCGG TCTGGTGGTT TATCTCTTTG CCAATGAAGT ACCAGAAATT 
GAGGATGAGG TGGTGCGGAT TGTGGCCGTA GCCCGCGAAG CTAATCCCCC CTCCCGCCAG 
GTGGGCCCTC GCACCAAAAT TGCCGTTGAT ACCCTGGAAC GGGATGTTGA TCCCGTCGGG 
GCCTGTATTG GTGCCCGCGG ATCTAGAATT CAGGCTGTGG TCAATGAACT GCGGGGTGAA 
AAGATTGATG TGATTCGCTG GTCTCCCGAT CCCGCCACCT ACATTGCTAA TGCCCTCAGC 
CCGGCCCGGG TGGAAGAGGT GCGGTTAATG AATCCAGAAG AGCGGCAAGC CCATATCCTG 
GTGACGGACG ATCAACTCAG TCTGGCGATC GGGAAAGAAG GACAAAACGT GCGCCTGGCT 
GCTCGGCTGA CGGGCTGGAA AATCGACATC AAAGATATTG CCACCTACGA TTACGAAGGT 
GAAAATCGCA AAGCCGAAGC TGAGGCGGCC GAAAAAGCAG CAGCCCAAGA GGCCGTGGAA 
CCAGAGGACG AAGACGACTT TGAGCCAGAG GAGCTAGAGT AG

Protein sequence

MSMVRLPGLR EMINAISRER NLPKYAVQGA LQEALMKGYE RYRRTLRLEG GHFDEDYFQN 
FDVEIDVEEE GFRVLATKTI VEQVDNPDHQ ISLSEVQEVA AEAQLGDTVI LDVTPEQQEF 
GRMAAIQAKQ VLAQKLRDQQ RKLVQEEFQD LESTVLQARV LRFERRSVIM AVSSGFGQPE 
VEAELPKKEQ LPNDNYRANA TFKVYLKKVL EGPHRGPQLL VSRADAGLVV YLFANEVPEI 
EDEVVRIVAV AREANPPSRQ VGPRTKIAVD TLERDVDPVG ACIGARGSRI QAVVNELRGE 
KIDVIRWSPD PATYIANALS PARVEEVRLM NPEERQAHIL VTDDQLSLAI GKEGQNVRLA 
ARLTGWKIDI KDIATYDYEG ENRKAEAEAA EKAAAQEAVE PEDEDDFEPE ELE