Gene Rcas_3892 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3892
Symbol
ID	5541398
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	5095727
End bp	5096953
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	59%
IMG OID	640896003
Product	glycosyl transferase group 1
Protein accession	YP_001433946
Protein GI	156743817
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGTATTC TTATTATTGG TCTTGGCGGG ATCAGCCGCC ATTTTCGCAA CTGGCCCGAA 
CGAACCCTGG GACAATCGCT GGTGCGCGCC GGCCACGAGG TCTATGCACT GACATACTGG 
CAACCTGACG CGCCGCACCT CGGTCTCGTC GAGCGCGCCG ACACCATCGA TGGTGTGCGC 
GTCATCCGTG TGCGCCCGCG CATCGTGCCA AACCGCGATC TTGTGTCTGT TCTGCGCAGC 
ATCCCACGCC CGGATGTCGT TCACCTGATG CATCCGCGCA ATGTTCTGGC GTGGGAAACC 
GTGCGCCGGA TGCGGCAGAG TCGTGTGCCG ATCTGCTGGA CATGGCTGGG ACCATTTCAT 
GATCGCTGGC TGGTGGACGA CCGCGAGCGT CCCTATGAAC GACCGCCACA TCCTGAGCGC 
CTGATCATGA GCGCACTCGA CCTGGTGCGT CGTGTGATGC GTGAACCATG GCGTGCGCGC 
GATCACTGGC GAAACTATGC GATCCATGCG CCATTGCGAC AGGTCAACCG CTTCATTCCC 
TGTTCACGCC ACGAAGCCGA TGTCCTGACC AACCTCGGCT TCGGGAACCG AATGGGACCG 
ATTGTGCCGC TCTGGATCGA TATGGAGTTC ATGAACGGAC CTGCTCCGGC ACCCCCGCCG 
CTAACCCGCC CGATCATTCC ATACATTGGT CAGTTAACCG TCCGCAAATG CTATGACATG 
ATCATCGATG TTATGTCGGT GATTGTCCGC CACTATCCGC AGGCATCCTT CGTCTTCGTA 
ACGCACAACC AGGCACAGCG CGCCGATCTG ATGCGTCGCG CCGCTCAACA GGGCATCGAA 
CACAACCTGC ATTTCCTCGG TACAATCAGC GAAGAAGAGA AACTGGCGTT GCTGCGCGCC 
AGTGATTTGC TTCCTTTTCC CTCGCGCTAC GAGGGCTTCG GGTTGCCGCT CCTCGAAGGT 
ATGGCTGCCG GAGTGCCCGT GATCTCGACC AATATTCCGG TGGTTAATGA AATTGTGATT 
CACGGTGAGA ACGGGTTGCT CATCCCCTAC GACGACACCC ATGCACTGGC GCAGGCAATG 
TTGACCCTGC TCGAAGATCA GGAGATGCGC AAACGCCTGA TCGCTGGCGG CAAACGCGCA 
TTGCATGAGC GCTTCGCACC AGAGCGCCTG GTTCGTCAGG TCATTGCGGT GTACGAAGAA 
GTCATTAGTG CATATGCCTC ATCCTGA

Protein sequence

MRILIIGLGG ISRHFRNWPE RTLGQSLVRA GHEVYALTYW QPDAPHLGLV ERADTIDGVR 
VIRVRPRIVP NRDLVSVLRS IPRPDVVHLM HPRNVLAWET VRRMRQSRVP ICWTWLGPFH 
DRWLVDDRER PYERPPHPER LIMSALDLVR RVMREPWRAR DHWRNYAIHA PLRQVNRFIP 
CSRHEADVLT NLGFGNRMGP IVPLWIDMEF MNGPAPAPPP LTRPIIPYIG QLTVRKCYDM 
IIDVMSVIVR HYPQASFVFV THNQAQRADL MRRAAQQGIE HNLHFLGTIS EEEKLALLRA 
SDLLPFPSRY EGFGLPLLEG MAAGVPVIST NIPVVNEIVI HGENGLLIPY DDTHALAQAM 
LTLLEDQEMR KRLIAGGKRA LHERFAPERL VRQVIAVYEE VISAYASS