Gene P9301_16831 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9301_16831
Symbol	nusA
ID	4912096
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9301
Kingdom	Bacteria
Replicon accession	NC_009091
Strand	+
Start bp	1414567
End bp	1415970
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	38%
IMG OID	640161280
Product	transcription elongation factor NusA
Protein accession	YP_001091907
Protein GI	126697021
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.422838
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCATTAG TTATTCTCCC AGGTTTAAAC AATCTTATTG AAGACATTAG TGAGGAAAAA 
AAATTACCTC CTAATATCGT TGAAGCAGCC TTGCGCGAAG CTTTGTTAAA GGGATATGAA 
AAATATAGAA GAACTTTTTA CATTGGAGTT AACGAAGATC CATTTGATGA AGAGTACTTC 
AGTAATTTTG ATGTTGGACT AGATCTAGAT GAAGAGGGTT ACAGGATATT ATCTAGTAAA 
ATAATTGTTG AAGAAGTAGA GAGCGAAGAT CATCAAATAT CTCTAATAGA AGTTAAACAA 
GTTGCTGATG ATGCGCAAAT AGGTGACACA GTTGTATTAG ATGTCACTCC TGAAAAAGAG 
GATTTTGGGC GAATGGCTGC TTCAACAACA AAGCAAGTTT TAGCACAAAA ATTAAGGGAT 
CAACAACGAA AAATGATCCA AGAAGAATTT GCAGATTTGG AGGATCCTGT TTTAACTGCA 
AGAGTTATCA GATTTGAAAG ACAATCAGTG ATTATGGGAG TTAGTTCGGG AATCGGCAGA 
CCCGAGGTTG AAGCAGAACT TCCCAAGAGA GATCAATTAC CAAATGATAA CTATAGAGCA 
AATGCAACTT TCAAAGTATT TTTAAAAGAA GTTAGCGAAA TTGCTAGAAA AGGTCCACAA 
CTTTTTGTGA GTAGAGCTAA CGCTGGTTTA GTAGTTTATT TATTTGAAAA TGAAGTACCG 
GAAATTCAGG AAGGTACAGT AAAAATAGTT GCTGTTTCAA GAGAAGCGAA TCCTCCTTCA 
AGAGCTGTTG GGCCAAGAAC AAAAGTAGCT GTTGATAGCG TCGAAAATGA GGTCGACCCT 
GTAGGTGCTT GTATTGGAGC GAGAGGAGCA AGAATCCAAC AAGTAGTTAA TGAATTAAGA 
GGAGAAAAAA TTGATGTTAT TAAATGGTCA TCTGACCCAA TACAGTATAT TTTGAACTCC 
TTAAGTCCGG CTAAAGTCGA TCTCGTGAGA CTTGTTGACC CTGAAGGTCA ACACGCGCAT 
GTACTAGTTC CTCCTGATCA ATTAAGTCTC GCAATTGGTA GAGAAGGACA AAATGTAAGA 
CTTGCGGCAA GATTAACTGG TTGGAAGATT GATGTTAAAA ACTCACATGA ATACGATCAG 
GAAGCAGAAG ATGCTGCAGT CTCTGAATTA ATTATCCAAA GAGAAGATGA AGAGAAACTC 
CAGCGTGAAG CTGAGCTTAG ATTAGAAGCA GAACAAGCTG AGCGTGCTGC GGAAGATGCA 
AGATTAAGAG AGCTTTATCC CCTTCCCGAA GATGAAGAAG AATATGGAGA GGAACAATAC 
GAAGGAGAAG AATTAACAGA TAATGATCCA TTAGAGACTC TTCAAGATAC TGACATATCT 
GCCAAAGAGG AGAAAAAACG GTGA

Protein sequence

MALVILPGLN NLIEDISEEK KLPPNIVEAA LREALLKGYE KYRRTFYIGV NEDPFDEEYF 
SNFDVGLDLD EEGYRILSSK IIVEEVESED HQISLIEVKQ VADDAQIGDT VVLDVTPEKE 
DFGRMAASTT KQVLAQKLRD QQRKMIQEEF ADLEDPVLTA RVIRFERQSV IMGVSSGIGR 
PEVEAELPKR DQLPNDNYRA NATFKVFLKE VSEIARKGPQ LFVSRANAGL VVYLFENEVP 
EIQEGTVKIV AVSREANPPS RAVGPRTKVA VDSVENEVDP VGACIGARGA RIQQVVNELR 
GEKIDVIKWS SDPIQYILNS LSPAKVDLVR LVDPEGQHAH VLVPPDQLSL AIGREGQNVR 
LAARLTGWKI DVKNSHEYDQ EAEDAAVSEL IIQREDEEKL QREAELRLEA EQAERAAEDA 
RLRELYPLPE DEEEYGEEQY EGEELTDNDP LETLQDTDIS AKEEKKR