Gene Tery_3978 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_3978
Symbol	nusA
ID	4244544
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	6152058
End bp	6153338
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	38%
IMG OID	638108894
Product	transcription elongation factor NusA
Protein accession	YP_723476
Protein GI	113477415
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAATGG TTAGTTTGCC TGGACTTAAA GAGTTAATCG GAAATATTAG TAAAGAACGT 
AATTTACCAA AACAAGCAGT TCAGACTGCT TTACGAGAAG CTCTATTAAA AGGATATGAA 
CGCTACAGAC GAACTCAACG TGTAGATGGA GTCAACTTCA CAGATGATTA CTTCGAAAAT 
TTTGAAATAG AACTGGATAT TGAAGAAGAA GGTTATCGAG TATTAGCTAC AAAAACTATT 
GTTGAAGAAG TAACAAATCC AGATCATCAT ATAGCTCTCC AAGAAGTTTT AGAAGTAGCC 
TCAGAAGCTC AGTTAAATGA TACAGTATTC TTGGATGTGA CACCCGAAAA AAATGAATTT 
GGTCGCATGG CTGCTATACA GACTAAACAA GTATTAGCTC AAAAGCTACG AGATCAACAA 
CGAAAAATGA TTCAAGAAGA ATTTCAAGAT TTAGAAGGAG AAGTTCTCCA AGCCAGAGTT 
TTGAGATTTG AAAAACAGTC AGTTATCTTA GCTGTAAGTA GTGGATTTGG TAGACTAGAA 
GTAGAAGCTG AACTGCCTAA AAAAGAACAA CTACCTAATG ATAACTACCG TGCTAATGCT 
ACTTTTAAAG TCTATTTGAA GCGAGTTTGT GAAGGGTCAA CTCGTGGGCC TCAATTACTT 
GTGTCTAGAG CTGATGCCGG CTTAGTGGTT TATTTATTTG AAAATGAAGT CCCAGAAATT 
GAAGATGAAG TCGTAAGAAT TGTGGCAGTT GCTAGAGAGG CAAATCCCCC ATCTCGGCAT 
GTTGGTCCCA GAACTAAAAT AGCAGTTGAT ACTTTAGAAA GGGATGTAGA TCCAGTGGGA 
GCTTGCATTG GTGCAAGGGG CTCAAGAATT CAGGTAGTTG TGAATGAGTT GAGAGGTGAA 
AAAATAGATG TAATTCGCTG GTCTCCAGAC CCTTCTATAT ATATAGCTAA TTCTCTTAGT 
CCAGCTAGAG TAGATGAAGT TCGTTTAATT GATCCAGAGG AAAGGAGGTC TCATATTTTG 
GTGTCTGAAG ACCAACTTAG TTTGGCTATC GGCAAGGAAG GACAAAATGT GCGTTTAGCT 
GCTCGTTTGA CAGGGTGGAA AATTGATATT AAGGACACAA ATAGATATGA CCATGCTGAA 
GAAGATAGCA AAGTTGCGGC TGAAGTCTCT CATCGTCAAG CGTTAGCTGA ACAAGAAGAA 
AATAAAATTG AGGAATCAGA ATTAGAAGTA ATAGAAAATA CTTTCGACAA AAATTTTAAT 
GAACCAGATG ATTCTTTTTA A

Protein sequence

MSMVSLPGLK ELIGNISKER NLPKQAVQTA LREALLKGYE RYRRTQRVDG VNFTDDYFEN 
FEIELDIEEE GYRVLATKTI VEEVTNPDHH IALQEVLEVA SEAQLNDTVF LDVTPEKNEF 
GRMAAIQTKQ VLAQKLRDQQ RKMIQEEFQD LEGEVLQARV LRFEKQSVIL AVSSGFGRLE 
VEAELPKKEQ LPNDNYRANA TFKVYLKRVC EGSTRGPQLL VSRADAGLVV YLFENEVPEI 
EDEVVRIVAV AREANPPSRH VGPRTKIAVD TLERDVDPVG ACIGARGSRI QVVVNELRGE 
KIDVIRWSPD PSIYIANSLS PARVDEVRLI DPEERRSHIL VSEDQLSLAI GKEGQNVRLA 
ARLTGWKIDI KDTNRYDHAE EDSKVAAEVS HRQALAEQEE NKIEESELEV IENTFDKNFN 
EPDDSF