Gene Rcas_1029 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1029
Symbol
ID	5538495
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	1342052
End bp	1343134
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	60%
IMG OID	640893168
Product	glycosyl transferase family protein
Protein accession	YP_001431151
Protein GI	156741022
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTCAT CGGCAACCGA AACATCACAT ACTGCTGCGT TGCAATCAGC GATGGCGCTT 
CCTTTCGTTT CGATCATAAC GCCCTGCTAC AACGAACATC GCACGATTGG TCTGTTGCTC 
GAAGGCATCT ATCGCCAATC GTACCCGCGC ACAGCGATGG AAGTGGTGAT CGCTGATGGC 
GGCTCGACTG ACGCGACACT TGAGTTTATT CATGCATTCC AATCGCGCCA TCCCGATCTG 
GCGATTCGGG TTGTGCCCAA CCCGCAACGC ATCACGCCGG CGGCATTGAA TCGCGCGATT 
GCTGCTGCGC GCGGTGAGAT ACTTATTCGT CTCGACGCCC ATGCTATTCC TGCGCGCGAT 
TATGTGGCGC GCTGTGTGGA GGCGCTCGAA CAGGGGCTGG GCGATAATGT CGGCGGCGTA 
TGGGAGATTC GCCCTGGAGA CGATAGTTGG ATTGCGCGCG CCATCGCGGT AGCGGCGTCG 
CATCCGCTTG CGGTTGGCGA TGCACACTAC CGGCGCGCGC CTGAGACGGC ACGTTCGGTA 
GATACGGTTC CGTTTGGCGC GTTTCGTCGT GCGTTGTTCG ATCGCATCGG ATTATTCAAT 
GAGCGACTGC CGATCAATCA GGATTATGAA TTGAACGCTC GAATCCGCCG GCATGGTGGT 
GTCGTCTGGC TCGACCCGGC GATCCGATCG GTGTATATGC GTCCGACGTT GGGCGCTCTG 
GCGCGGCAGT ACTGGCGATA CGGTTTTTGG AAGGCGCGTA TGCTCACCCA CTATCCGACG 
ACGCTGCGCT GGCGTCAGGC TGTTCCCCCG CTCTTTGTTG CCGGTTTGCT TGGGCTGGCG 
ATCAGCGCGC CATGTGCGAA GGCTGCACGG CGGATGCTGG CTGCACTGAT TGGGCTGTAT 
GGAGGAGCAC TTGGCGCGGC CGGCGCGCAT GCCGCAGTGG GGCGTCGCGA TCCGGCTCTC 
AGCGCCGGAT TGCCGCTGGC AATAGCGACG ATGCACTTTT GTTGGGGAAG TGGATTTCTC 
TGGAGCGTGT GGTCGCTGCT GGCAGAGCGC CGATCTTCTG AACAGGTCGT ACAGACGCGA 
TGA

Protein sequence

MSSSATETSH TAALQSAMAL PFVSIITPCY NEHRTIGLLL EGIYRQSYPR TAMEVVIADG 
GSTDATLEFI HAFQSRHPDL AIRVVPNPQR ITPAALNRAI AAARGEILIR LDAHAIPARD 
YVARCVEALE QGLGDNVGGV WEIRPGDDSW IARAIAVAAS HPLAVGDAHY RRAPETARSV 
DTVPFGAFRR ALFDRIGLFN ERLPINQDYE LNARIRRHGG VVWLDPAIRS VYMRPTLGAL 
ARQYWRYGFW KARMLTHYPT TLRWRQAVPP LFVAGLLGLA ISAPCAKAAR RMLAALIGLY 
GGALGAAGAH AAVGRRDPAL SAGLPLAIAT MHFCWGSGFL WSVWSLLAER RSSEQVVQTR