Gene Rcas_3942 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3942
Symbol
ID	5541448
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	5148229
End bp	5149416
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	60%
IMG OID	640896050
Product	glycosyl transferase group 1
Protein accession	YP_001433993
Protein GI	156743864
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.484579
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.520896
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATTA CTCTGATCGG TCCGACTTAC CCATTTCGCG GTGGCATTGC GCACTACACC 
ACGCTCCTGA CCCATCATCT GCGCCAGCAC CACGATGTCC GGTTGATCTC GTACCTCAAG 
CAGTATCCCA AATGGCTCTA CCCCGGCAAT ACGGCGATGG ACCCCAGTCC TGATGAGAGT 
GCGCTACGTA TCGAGTGCGA CCGGGTGCTG ACCCCGATGA ATCCGCTGAC CTGGTGGCGG 
GCCTTTCGCA TGATCCAGCG CGATAACCCT GATCTGTTGC TGCTTCAGTG GTGGACGCCG 
TTCTGGTCGC CGATGTTGTT TGTGCTGACC CGGTTGGTGC ACCGGCATAC GAATGTGCGC 
ATCCTTTTTT TATGCCATCA CGTCATTGCT CCTGATGGTG GTATGTTCGA CTGGTATCTG 
GCGCGGCGTA TTCTCTGGCG TGGGCATGCC TTCATTGTGA TGAGCGAAGA AGATTTCGCA 
CTGCTGCGGC GCGCGCTGCC GTGGGCGCGC ATCAAAGGGG TCACCCACCC ACCCTACGAT 
GTGTTCAGCC GCACGCCGTT GCCGCGTGCC GACGCGCGCG CCCGCCTTGG TTTGAACGCC 
GATGATCCGG TGCTGCTCTT CTTCGGGTTT ATCCGGCGCT ACAAAGGGCT GCGTCATCTG 
ATACGGGCGC TGCCGCTGGT TCGTCAGCAC ATTCCTGCGC GATTGTTGAT CGTCGGCGAG 
TTCTGGGAGG ATGATCGTCC GTATCGCAGT CTGGTGCGCG AACTCGGTCT CGACGACGTG 
GTGCATTTCC ATAGCGAGTA TGTTCCCAAC GAACAGATCG CGGTCTATTT CTCGGCATGT 
GATGCGGTCG TACTCCCCTA TCTCGAAGCG ACGCAAAGTG GTGTGGCGCA ACTGGCAATC 
GGGTTCGAGA AGCCGATGAT TGCAACGTCG GTCGGCGGGA TGCCGGAGAC CATCCACGAC 
GGTGAAACCG GATTGATTGT TCCGCCAGGG GATAGCGTTG CACTGGCGGA TGCCATTGTG 
CGCTTTTTCC GTGAGGGGCT GGCTGAACCG TTTGCCCAAA ACATCCGTGT GGCGCGCGAG 
CGCGACTCAT GGATGCCGCT GGTGCGCCTG ATCGAAGAAC TGGCGGAACC GTCCGCAGCG 
CACGCCGAAC AACCGGCGCC GCAGACGGCG TCGCCGAGGG TGTTGTAA

Protein sequence

MKITLIGPTY PFRGGIAHYT TLLTHHLRQH HDVRLISYLK QYPKWLYPGN TAMDPSPDES 
ALRIECDRVL TPMNPLTWWR AFRMIQRDNP DLLLLQWWTP FWSPMLFVLT RLVHRHTNVR 
ILFLCHHVIA PDGGMFDWYL ARRILWRGHA FIVMSEEDFA LLRRALPWAR IKGVTHPPYD 
VFSRTPLPRA DARARLGLNA DDPVLLFFGF IRRYKGLRHL IRALPLVRQH IPARLLIVGE 
FWEDDRPYRS LVRELGLDDV VHFHSEYVPN EQIAVYFSAC DAVVLPYLEA TQSGVAQLAI 
GFEKPMIATS VGGMPETIHD GETGLIVPPG DSVALADAIV RFFREGLAEP FAQNIRVARE 
RDSWMPLVRL IEELAEPSAA HAEQPAPQTA SPRVL