Gene Rcas_1134 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1134
Symbol
ID	5538600
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	1468453
End bp	1469781
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	58%
IMG OID	640893268
Product	NusA antitermination factor
Protein accession	YP_001431251
Protein GI	156741122
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000746814
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.939177
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAGCG ATTTTTATGC AGCAATCTCA CAGATTGCGT CCGAACGCGG CATTCCCAAG 
GAAGCCATCG TCGAGGTCAT GGAAAAGGCG CTGGCGACAG CGTATCGCCG AACGCTCGGT 
CCTAACCCAC CGCCAATGGA GATATCGGTC CGGCTGGACC CGCTGACGGG CGCGGCGCGC 
GTCTATTCCG AAAAACAGGT CGTTGACGAT GTCTACGATG AGCGCTTTGA GATCGATCTG 
GAGAGCGCCC GCAAGATCAA GCCCGATGTC GAACTGGGCG AGTCGGTCGT CGTCGAGACG 
ACGCCGAAGG ATTTTGGACG AATCGCAGCG CAAACGGCGA AACAGGTTAT CCTTCAGGGA 
ATCAAGGAAG TCGAGCGCGA ACACATCTAT GGCGAATACA TGGATCGCGA GGGCGAACTG 
GTCACGGCGA CCGTACAGCG CATGGCAAAG GGCAACGTCA TTCTCGAAAT GGGAAAAGCC 
GAAGCCGTCT TGCCGCCGAA GGAACAGGTC GAGACCGATC GCTACTACCA CGGGCAGCGC 
CTGAAGGTCT ACCTGATGGA AATCCGCCGT GAGGAACGCG GACCGAAACT GATCGCATCG 
CGCGCGCACA AAAATCTGAT TACGCGCCTC TTCGAGATGG AAGTGCCGGA GATTTATAAT 
GGCGCCGTCG AGATCAAGTC GATCGCGCGC GAGCCGGGTA TCCGTACCAA AGTAGCAGTC 
GCGGCGCGGC AGGAGGGCAT CGATCCGGTT GGTTCGTGCG TCGGTATGCG CGGCATTCGC 
ATTCAGAACA TCGTCAACGA ACTGAATGGC GAAAAGATCG ATGTTGTGCA GTGGTCGTCA 
AATCCAAAAG AGTTCATTGC GAATGCACTG TCGCCAGCAC AGGTCGTTGA GGTGCAGTTG 
CGCGACGATG AACACGCTGC GACGGTCATT GTGCCGGATA AGCAACTCTC GCTGGCGATC 
GGTAAAGAAG GGCAGAATGT GCGCCTGGCG GCAAAACTGA CGGGATGGCG GATCGATATC 
AAGAGCGCGT CGGCGTTGCT CGACGAAGAG CGCGCAGCGG CGGAGGCGCG CGATGCGGCA 
GAAGCGGAGG CGCTGGCGAC TGAGGCGGCG CTGGCGACGG CAAAGGTCGA GATGCGCAAA 
GTGTACGCCG ATGGAACGAT CGTCTATCGG AAGCATCGCT ATGGTCCACT CGGCGACGAC 
CTGGTCGGCG AAACGGTGCA ACTGCGCGCG ACGCCGCAAA AACTGTACAT CTATCGCGGT 
GATCGCCTGG TGGCATCGTA TATGCTCGTT GGCGACGATG AAGAGGATGC GATCGAGGGC 
GACGAGTAA

Protein sequence

MKSDFYAAIS QIASERGIPK EAIVEVMEKA LATAYRRTLG PNPPPMEISV RLDPLTGAAR 
VYSEKQVVDD VYDERFEIDL ESARKIKPDV ELGESVVVET TPKDFGRIAA QTAKQVILQG 
IKEVEREHIY GEYMDREGEL VTATVQRMAK GNVILEMGKA EAVLPPKEQV ETDRYYHGQR 
LKVYLMEIRR EERGPKLIAS RAHKNLITRL FEMEVPEIYN GAVEIKSIAR EPGIRTKVAV 
AARQEGIDPV GSCVGMRGIR IQNIVNELNG EKIDVVQWSS NPKEFIANAL SPAQVVEVQL 
RDDEHAATVI VPDKQLSLAI GKEGQNVRLA AKLTGWRIDI KSASALLDEE RAAAEARDAA 
EAEALATEAA LATAKVEMRK VYADGTIVYR KHRYGPLGDD LVGETVQLRA TPQKLYIYRG 
DRLVASYMLV GDDEEDAIEG DE