Gene CPR_1661 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1661
Symbol	nusA
ID	4204988
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	1853943
End bp	1855043
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	30%
IMG OID	642566211
Product	transcription elongation factor NusA
Protein accession	YP_698976
Protein GI	110803140
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGAAG AATTTCTAGG GGCATTATCT GAAATAGTAA AAGAGAAAGG TATTTCAGTA 
GAGGCTTTAT TAGAAACTAT AGATGATGCT ATAATAGCAG CTTATAAGAA AAACTTTTCA 
AATTCAGGAA CAACTGCACA AAATGTAAAG GTAAAACGTG ATGAGAAATC AGGAGAAATC 
CATGTTTATG CTCAAAAAGT TGTTGTTGAA GAAGTTTATG ATGATGTAAC AGAAATAAGT 
TTAGAAGATG CAAAGGCTAT TAGTGCTATT TATCAATTAG ATGATATAGT AGAAATAGAA 
GTAACACCTA AAAACTTTGG AAGAGTTGCA GCACAACTTG CTAAGCAAAT GGTTATCCAA 
AGAATAAAAG AATCTGAGAG AAATGTAATT TACTCAGAAT TTGCAGAAAA AGAATTTGAC 
ATATTACCTG GTACAGTAAT AAGAAAAGAT AAAGGTAATG TATTTGTAGA CTTAGGAAAA 
ATAGAAGGTG TTTTAGGACC AAATGAACAA ATGCCTACAG AAAAATATAA CTTCAATGAA 
AAATTACAAT TATACGTAGT TGAAGTTAAG AAAACATCTA AAGGTGCTTC AGTTTTATGT 
TCAAGAACAC ATCCAGGTTT AGTTAAAAGA TTATTTGAAT TAGAAGTTCC AGAAATATAT 
GAAGGAATAG TTGAAATAAA AAGTATAGCT AGAGAAGCAG GATCAAGAAC TAAAATAGCT 
GTTTACTCAA ATGATGAATC AGTAGATGCT ATGGGAGCTT GTGTTGGACC TAAGGGTGTT 
AGAGTTCAAA ATATAGTTAA TGAACTAAAA AATGAAAAAA TTGATATAAT AAAATGGAGT 
AATACTCCAT CTGAGTATAT AGAAAATGCT TTAAGCCCAG CTAAGGTTGT AAGTGTAGAA 
GCTGATGAAG AAACTAAATC AGCTAAGGTT ATAGTTGATG ATAGTCAATT ATCATTAGCT 
ATAGGTAAAG AAGGACAAAA TGTTAGATTA GCAGCTAAAT TAACTGGTTG GAAAATAGAC 
ATAAAGAGCA AATCTAAAGC AGAAGAATTA TTACAAGAAG AAGATATTGT TGTTAAAGAA 
GACACTATAA TAGAAGAATA A

Protein sequence

MNEEFLGALS EIVKEKGISV EALLETIDDA IIAAYKKNFS NSGTTAQNVK VKRDEKSGEI 
HVYAQKVVVE EVYDDVTEIS LEDAKAISAI YQLDDIVEIE VTPKNFGRVA AQLAKQMVIQ 
RIKESERNVI YSEFAEKEFD ILPGTVIRKD KGNVFVDLGK IEGVLGPNEQ MPTEKYNFNE 
KLQLYVVEVK KTSKGASVLC SRTHPGLVKR LFELEVPEIY EGIVEIKSIA REAGSRTKIA 
VYSNDESVDA MGACVGPKGV RVQNIVNELK NEKIDIIKWS NTPSEYIENA LSPAKVVSVE 
ADEETKSAKV IVDDSQLSLA IGKEGQNVRL AAKLTGWKID IKSKSKAEEL LQEEDIVVKE 
DTIIEE