Gene Rcas_3974 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3974
Symbol
ID	5541480
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	5180220
End bp	5181686
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	55%
IMG OID	640896082
Product	undecaprenyl-phosphate galactose phosphotransferase
Protein accession	YP_001434025
Protein GI	156743896
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2148] Sugar transferases involved in lipopolysaccharide synthesis
TIGRFAM ID	[TIGR03022] Undecaprenyl-phosphate galactose phosphotransferase, WbaP [TIGR03025] exopolysaccharide biosynthesis polyprenyl glycosylphosphotransferase

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0593846
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.00174462
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCGATCT CAAAAGGAAT TGCAGCGCAC GCAAAGCCAG GACATATCGT TCGACGCGCC 
GATCGCTGGC TGTTGAACGG TGTGCTGGTT ATCAATGATA CCCTGGCGGT GCTTATCAGT 
TTTGCAATCG CCTATGCGGT GCGTTTCTGG AGCGACCTGC CGATTTTCGA GGAAGGGTGG 
GTCAATCCTG ATTTCTATGC GATGGTTGTG CTGGCGATGA CGCCGGTGTA TCTGGGATTG 
TTTGCGGCGT ATGGTCTGTA CAATCCGGTG AATCTGCTGG GTGGTGCGAC TGAATATGCC 
CGGATGTTCA ATGCTGTCAC CACTGGGGTC TTACTTGTCA TCATCGTCAG TTTCCTGGTT 
CCCAACTTTA TTGTTGCGCG TGGATTTCTT ATTCTGTCGT GGGGTTTGCT GGTCATCTTC 
GGCATTACCG GTCGTTTTGC GGTGCGCCGA TTTGTTTACG CTCAGCGTCA GGCAGGGCGG 
TTTGTCAACC ACACGCTGAT CATCGGCGCG AATCCCGAAG GATTGGCGAT TGTCGAACAA 
TTACGGTCGG CAAAAACCTG TGGGATGCGC ATCGTTGGCT TCGTCGATGA CTACCTGCCG 
GTGGGCAGTG AACCAATCCC GGGTGTTCCG GTGTTGAGTG CGTCTACTGC GTTTGCGGAA 
CAGATCCGGC AGCACGACAT CGATACCGTG ATTGTCGCCA ATACGGCAAT GATGCGAGAG 
CAACTGCTCT CGCTCTACAG CACCCTCGAT ACCTTTCAGG ACGTTGAAGT GCGCCTGGCG 
TCGGGTCTGT TCGAACTCCT GACGACCGGA GTGCGCGTTC GTGAAGAAGG TTTCGTTCCC 
CTGCTGGTGC TCAACAAGAC GCGAATCACC GGCGTGCATC TGATTGCCAA GACCATACTC 
GATTACACTC TGGCTGCCAC AGCAGTGATC TTCCTCATTC CTTTCTTCCT TGTTGTCGCT 
TATCTGATCA AGCGCGACTC GCCCGGTCCG GTCATCTACC GGCGGCGGGT TGTCGGTCAG 
GGGCGTCGTG AGTTCGATGC CCTCAAACTG CGCACCATGC ACATTGATGG CGATCGGTTG 
CTGACGCCGG AGCAGAAACG CGAACTCGAA GAACACGGTA AGTTGAAGGA CGATCCGCGT 
GTCACGAGAA TTGGCGCATT TCTGCGTAAG TATAGCCTCG ATGAGTTGCC GCAGTTGTTC 
AATGTGCTGC GCGGTGAAAT GAGCCTGATT GGTCCGCGTA TGATCACCCG CCAGGAACTT 
GAAAAATTCG GCAAATGGCA GCACAACCTC TCGACAGTGA AACCCGGTCT GACCGGCTTG 
TGGCAGGTGA GCGGGCGGAG CGATCTGTCA TATGAGGATC GCGTGCGTCT GGATATGCAC 
TATATCCGCA ACCATACGAT CTGGCTTGAT CTCCAGATCC TGTTTCAGAC CATACCGGCA 
ATATTGACCG GTCGTGGCGC CTACTGA

Protein sequence

MAISKGIAAH AKPGHIVRRA DRWLLNGVLV INDTLAVLIS FAIAYAVRFW SDLPIFEEGW 
VNPDFYAMVV LAMTPVYLGL FAAYGLYNPV NLLGGATEYA RMFNAVTTGV LLVIIVSFLV 
PNFIVARGFL ILSWGLLVIF GITGRFAVRR FVYAQRQAGR FVNHTLIIGA NPEGLAIVEQ 
LRSAKTCGMR IVGFVDDYLP VGSEPIPGVP VLSASTAFAE QIRQHDIDTV IVANTAMMRE 
QLLSLYSTLD TFQDVEVRLA SGLFELLTTG VRVREEGFVP LLVLNKTRIT GVHLIAKTIL 
DYTLAATAVI FLIPFFLVVA YLIKRDSPGP VIYRRRVVGQ GRREFDALKL RTMHIDGDRL 
LTPEQKRELE EHGKLKDDPR VTRIGAFLRK YSLDELPQLF NVLRGEMSLI GPRMITRQEL 
EKFGKWQHNL STVKPGLTGL WQVSGRSDLS YEDRVRLDMH YIRNHTIWLD LQILFQTIPA 
ILTGRGAY