Gene Ccel_0454 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_0454
Symbol
ID	7309333
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	521381
End bp	522529
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	40%
IMG OID	643607384
Product	NusA antitermination factor
Protein accession	YP_002504816
Protein GI	220927907
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGCTG AGTTGATATT AGCTCTTGAA CAGCTGGAAA AGGAAAAGGG TATTAAAAAG 
GAAATAATTA TTGAGGCTAT TGAGGCTGCA CTTATTTCTG CATACAAGAA AAACTTTGGT 
TCAGCAATGA ACGTTAAAGT AAATATAGAT AGGGTAACAG GTGATGTAAA AGTTTTTGCA 
CTCAGGAAAG TTGCTGAAGA CCCAGATGTC GAGGCAATGG ACATATCAAT AGGAGAGGCT 
GCCAAGCTTA ATCCTACACT GGACATAGGA GATTATGTAG AATCTGAAGT TACTCCAAGG 
TCCTTTGGAA GAATTGCTGC CCAGACTGCC AAACAGGTAG TAGTTCAAAA ACTAAGAGAA 
GCAGAAAGAG GAATCATTTA CGATGAGTTC TACAATAAGG AAAGCGACAT TGTAACAGGA 
ATCATTCAAA GGATAGAAAA GAGAAATGTA ATAGTTGACC TTGGGAAAAC TGAAGCCGTT 
CTTGGGTCTA CCGAGCAGAC TCCCGGAGAG GAATACAGAT TTAACGAACG ACTGAAGTCA 
TATATTGTAG AGGTTAAAAA AACTACAAAA GGTCCTCAGA TTATGCTTTC CAGAACACAT 
CCGGGCTTGG TAAAAAGGTT ATTTGAACTG GAAGTACCTG AAATTCATGA CGGTACTGTT 
GAAATAAAGA GTATTTCAAG GGAACCGGGG TCAAGGACTA AGCTAGCTGT GTACTCTAAA 
GATGAAAATG TTGATCCTGT AGGAGCATGT GTTGGGCAGA AGGGTACCAG GGTTCAGGCT 
ATTGTTGATG AACTGAGGGG CGAAAAGATT GATATTATCA AATGGAGTAA TGATCCCAAA 
GATTATATAT CCAGCAGTTT AAGCCCCGCT AAGGTTGTGA GGGTAGATGT GGACGAAGAA 
GAAAAATCTG CAAAGGTAGT GGTTCCTGAC TATCAGCTTT CATTGGCAAT AGGAAAGGAA 
GGCCAGAATG CAAGGTTGGC CGCAAAGCTT ACCGGCTGGA AAATTGATAT AAAGAGCGAA 
TCCCAGCTAA GACAGTCAAT TGAGAAACAA CTGTTTGATG ATAGCTTAAA CAACGGATAT 
TTGGATGAAA CAGATACTGA CAGTATGAAT TATGATAATG ATGACCATGA AAATAATATA 
ATTGATTGA

Protein sequence

MSAELILALE QLEKEKGIKK EIIIEAIEAA LISAYKKNFG SAMNVKVNID RVTGDVKVFA 
LRKVAEDPDV EAMDISIGEA AKLNPTLDIG DYVESEVTPR SFGRIAAQTA KQVVVQKLRE 
AERGIIYDEF YNKESDIVTG IIQRIEKRNV IVDLGKTEAV LGSTEQTPGE EYRFNERLKS 
YIVEVKKTTK GPQIMLSRTH PGLVKRLFEL EVPEIHDGTV EIKSISREPG SRTKLAVYSK 
DENVDPVGAC VGQKGTRVQA IVDELRGEKI DIIKWSNDPK DYISSSLSPA KVVRVDVDEE 
EKSAKVVVPD YQLSLAIGKE GQNARLAAKL TGWKIDIKSE SQLRQSIEKQ LFDDSLNNGY 
LDETDTDSMN YDNDDHENNI ID