Gene Rcas_3971 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3971
Symbol
ID	5541477
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	5176937
End bp	5178022
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	62%
IMG OID	640896079
Product	UDP-N-acetylglucosamine 2-epimerase
Protein accession	YP_001434022
Protein GI	156743893
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0381] UDP-N-acetylglucosamine 2-epimerase
TIGRFAM ID	[TIGR00236] UDP-N-acetylglucosamine 2-epimerase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.862921
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0340868
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACAG TGGTGACAGT TCTGGGCACC CGCCCGGAGA TTATCAAACT ATCGCCGCTC 
ATTCCACTGC TCCGTGAGCG GTTTCGCCAC ATCCTCGTGC ATTCCGGGCA GCACTATTCT 
TTCGAGATGG ACGCGGTCTT TTTCGAGGAA TTGGGGCTGC CGGCGCCTGA TTACACGCTT 
GGCGTCGGCT CAGCGTTGCA CGGCGAACAG ACAGCGCGCA TGCTGTCGCG GCTGGAGCCG 
ATCCTGCTTG AAACAAAGCC CGACATGGTT CTGGTTCAGG GTGACACGAA TACGGCGATG 
GCAGGCGGAT TGTGCGCGGC CAAACTCAAT ATTCCGGTCG CACATCTCGA GTCTGGTGGG 
CGGTCCTTCA ATCGCCAGAT GCCCGAAGAA CTCAACCGCA TTATTCTCGA CCATATTGCG 
ACGCTGTTGC TGGCTGCCGA TGAAACCGCC GAGCGCAATC TGCTGGCGGA AGGGTTGCCG 
CCTGAGCGGA TCCGTATGGT TGGGTCGAGT GTGATCGATG CTGTCGCGCG GAACCGGCAG 
CATGCCCGCC GCTCGACCAT CGTGCAGCGT CTGGAGGTGA CCCCCGGCGA CTACCTGGTG 
CTGACCCTGC ACCGCAGCGA GAATACCACT CCTGCCGTGC TGCCCGGCAT GATCCGCGCC 
CTCGGTGAGT TGGCGGAAGA GCACACAATC GTGTTTCTGC TGCATCCGCG CACTGCGGCG 
GCGATGCGAT CCTATGGCAT TGTCATGCCG CGCAATATTC GCGTCAGTGA GCCGCTTGGC 
TATCTCGACA CGCTCTGCCT CGTCGAGCAG GCGCGCGCGC TTCTCACCGA TTCTGGCGGC 
TTGCAAGAGG AGGCGGGCGC ACTGGGAACG CCAACGCTCA TCCTGCGCAA CGAAACCGAG 
TGGCGTTACC TGGTGGACGC CGGGATGCAC GTGCTGGTCG GTAACACGTA TGAGTCTATT 
CTTAGTGGCG CTCGTCGATG GTTGCAACCC GCAGCGCTTG CCCGGTTGCG GTCCGCGCCG 
GCGCCGATCC GCACCGGCGC CAGTGAACGC GCCGTCGCAG CGATGGTTGA CGTGTTATAC 
CAATGA

Protein sequence

MKTVVTVLGT RPEIIKLSPL IPLLRERFRH ILVHSGQHYS FEMDAVFFEE LGLPAPDYTL 
GVGSALHGEQ TARMLSRLEP ILLETKPDMV LVQGDTNTAM AGGLCAAKLN IPVAHLESGG 
RSFNRQMPEE LNRIILDHIA TLLLAADETA ERNLLAEGLP PERIRMVGSS VIDAVARNRQ 
HARRSTIVQR LEVTPGDYLV LTLHRSENTT PAVLPGMIRA LGELAEEHTI VFLLHPRTAA 
AMRSYGIVMP RNIRVSEPLG YLDTLCLVEQ ARALLTDSGG LQEEAGALGT PTLILRNETE 
WRYLVDAGMH VLVGNTYESI LSGARRWLQP AALARLRSAP APIRTGASER AVAAMVDVLY 
Q