Gene Rcas_0787 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0787
Symbol
ID	5538253
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	1029313
End bp	1030881
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	57%
IMG OID	640892939
Product	hypothetical protein
Protein accession	YP_001430922
Protein GI	156740793
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1807] 4-amino-4-deoxy-L-arabinose transferase and related glycosyltransferases of PMT family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.421707
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCACT CAATATCTTC CATCAAAGAA AGCGAAACAA CCATCGCTCA ACGACGCGCG 
CATCGAATAG CATCCTGGAG TGCGTTGAGC ATCGTACTTT TAGCGTTGAG CCTCTGGAAT 
CTCGATGGAC CAGCGATGTG GTGGGACGAG GGATGGACCC TATCGGTTGC GAGAAATTGG 
GCGGAGCAGG GGCACTACGG ACGCCTGCGC AATGGTCAGC GAGCGCGCCC TGGTCTGGAG 
GCGGCTTTCA CTACAACGTT GCCGGTTGGA ATGATGATGC GCGCATTTGG TGTGGGTCTC 
TGGCAGGGAC GACTCTTCGG AGCACTCTGT GCTGTGGCAG TTGTCCTGCT GTTGGCGGCG 
CTCGCAGCCA GATTGTATGA CCGGCGCGTC GCGGTTGCGA CAGTCGTTGC CGCCCTGTGT 
ATGACCGCAT TTCCGACAAT CCATCCATTG CTGCTGGGAC GCCGGGTGCT AGCAGAGATA 
CCGATGCTAA TGTATCTGCT GGTCGGATAT CTGTTCCTAT GGCGTGCGCT TGTCAATCGA 
TGGGTCGCAC TCTTCCCGGC GGCATTGTTT CTCGCGCTAG CCTGGGTGAG CAAAGCGCAA 
CTCTCACCTT TCCTGATTGT ATCGCTGACA ATGTCCGCGC TAGTCGCCGC GCTGATGCGC 
CGATGGCGCA TTGCCGCTCT TTTCACTCTC GTTGCAGGCG GAACAGTGCT TGGCGCCAGG 
ATCCTTCAGC AATCGGTCTA TCCGATTCTG ATCGACGCTC AACTGCCGCC AGACCCAACA 
ACAGGACTGA TTGAAACCGT TGCCATCGTG ACCGCCCCCG CTCGTCGCCT CGATGCCATC 
CAGAATCTCG CCATCTTTGG GCTTCCTGCT CTTTGTGGCA TGCTCTGGGG GACGTGGCGA 
CTGTGGCATG ATCGCTCTGC AGCCAGCAGC GGCGCGCCGG TCTGGTATAC TCGCCTGACC 
TTGCTCGCAC TATGCGGCAG CTGGCTAGCA TGGTACCTCG TGTTTTCCAT CGGATGGGTG 
CGTTACATGG GGCCTGCCAT TATTGTCGCG AGCATTTTTG TAGCTGACCT TCTAGCAAAC 
GCTACCGATG GCTTTGCCAT TCGGCATAGT CTCGTGTCGC TAATCAACCT TCTCACGTTA 
CGCCGGTGGA CACGGACGGG CGGAGCGGCG TTGTTCGGCA CAGTGCTCGT ACTCTGGGGA 
GGAACGTTGA CAGCGGTAAG CGTTGCCGCC ACCTATCCGG TACGCGACTA TTCCGCTCAG 
CGCGTGGCGC AGTGGCTCAA TGCGCAACCG GAAGGAACGA GGATCGAAAC GTATGAGACT 
GAGCTTCACT TTTTGCTTGA TCAACCCTAT ACTTTTCCGC CAGACCAGGT GCATGTTGCG 
TTGCTGCGAC GCCTCTGGGA AATAGACGAT AACGTGCTGA TCGCCTATGA TCCGATGGTC 
AACGACCCGG ATTTCCTGGT AGAGGGCGGA ACAAGCGTTG CCAAACTGTA TGAGTCGACA 
CTGGCAAGCG GACGATTCCG TCTCGTGCTG GAAGATGGAC CTTACCGTGT ATTCGAGCGA 
GTGCGCTAA

Protein sequence

MDHSISSIKE SETTIAQRRA HRIASWSALS IVLLALSLWN LDGPAMWWDE GWTLSVARNW 
AEQGHYGRLR NGQRARPGLE AAFTTTLPVG MMMRAFGVGL WQGRLFGALC AVAVVLLLAA 
LAARLYDRRV AVATVVAALC MTAFPTIHPL LLGRRVLAEI PMLMYLLVGY LFLWRALVNR 
WVALFPAALF LALAWVSKAQ LSPFLIVSLT MSALVAALMR RWRIAALFTL VAGGTVLGAR 
ILQQSVYPIL IDAQLPPDPT TGLIETVAIV TAPARRLDAI QNLAIFGLPA LCGMLWGTWR 
LWHDRSAASS GAPVWYTRLT LLALCGSWLA WYLVFSIGWV RYMGPAIIVA SIFVADLLAN 
ATDGFAIRHS LVSLINLLTL RRWTRTGGAA LFGTVLVLWG GTLTAVSVAA TYPVRDYSAQ 
RVAQWLNAQP EGTRIETYET ELHFLLDQPY TFPPDQVHVA LLRRLWEIDD NVLIAYDPMV 
NDPDFLVEGG TSVAKLYEST LASGRFRLVL EDGPYRVFER VR