Gene Rcas_1969 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1969
Symbol
ID	5539447
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	2519824
End bp	2521212
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	59%
IMG OID	640894104
Product	hypothetical protein
Protein accession	YP_001432075
Protein GI	156741946
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1807] 4-amino-4-deoxy-L-arabinose transferase and related glycosyltransferases of PMT family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0306284
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCTGACGC TGCCCCTCTT CAACGACGAA GCGATCTATC TGTACCGCGC CCAGCAATTC 
CCTGCCCAAC TCGAGTTCAC CGTCCATGAC GGCAAACTGA TCCACGAACT GCTCCTTGCC 
GCACTTGCCC GCCTACCCTG GGATCCATTG CTCACCGGCA GAATCCTGTC GGTGCTGTGT 
GGATGGCTTA CCGTTGTCGG GCTATGGCTC AGCGGAAGGA TCATTGGTGA TCGCACGGCG 
GGTCTGTTCG CCGGATTGCT GTACATTCTC TCACCGCTAG CAATCATCCA CGACCGCCTG 
GCTATTCCCG ACGCCATGCT GGGGAGTATA GCAGGCTTCC TGCTGGCGGC AAGCCTTCGT 
CTGACTCTTC TGCCGCAACC CAACCGCTGG CACGCAGCCG GGGTCGGCGC GCTCGGCGCC 
CTCGCCACGC TGGTCAAACT GCCAGGACTG TTCCTCTTCG CCCTCCCCGC GCTGATCATT 
GTGACCAGCG CGGCAACGCC GGAGCGCCGA CATCAACAAT GGGCGCTGCT GCGCACAGTC 
CTGATCATGA CCCTGCTGGC GCCCGCTTCA TTCGCGCCCT TCAACTATGG CGGAGCTGAA 
AACCATAAAG TCGGCGTTTT CAATCTGGCA CTCCAGATCG AGCGCCTGAC AGACAATGTC 
CGCCAGATTG GCGAATGGCT GGCGCTCACC CTGCCGCTGC CGACTCTCGC ACTCATCGGA 
TTGGGACTGA GCCAGCGCCC GACACGCCGC TTGATTCTGA CCCTCGTCGC AGCTGCCTGC 
GTCTTCTGTA TGGCGCTTGC CACGATTGGG AGCGTGCTCT ATCCTCGCTA CATCCTCCCT 
GCGTGGCCTC TGCTGCTCGT TGTCGCCGGC GTGGGACTGA GCCGCCTGTG CCATCTTCCT 
GTTGCGCTGC GTGGCGCTGG CATAGCGATA GCGCTTATCA ACGCGATATG GGGATCATTC 
TTCGCCATTC AATATGCCCA AAACCCGGCA CAGGCGCCGT TGACCACGGC TGATCGTCAC 
CAGTACATCG AGACATGGAC GGCGGGATAT CATCTCGATG AAATCACGCT TCTCTTGCAC 
ACTGAAGCCG AACAAAAAGG CGACATTGCG CTGTTAAGTC CGTTGCAACC GCGACTGATT 
CATATTGGTC CCAAGGTGTA TCTCAATGGC GATCCCCGCA TTTCCTTTGT CGATGTCGAT 
GTTGCGAGCG ATAATGCCAG ACAGTTGATC AATGAGATCA CCACGCAACG AACGGTTTAC 
GTTACACTCG ATGCCGAAGA AGTCGTCGCC TTCGACATCG AACGGCGCTT CCCTGAACTG 
AAGATTATTC GCGAGTGGCG CAATCCCCAC AGCGACATGG CGTTTTATCT GTATGTCTGG 
TCGCCGTGA

Protein sequence

MLTLPLFNDE AIYLYRAQQF PAQLEFTVHD GKLIHELLLA ALARLPWDPL LTGRILSVLC 
GWLTVVGLWL SGRIIGDRTA GLFAGLLYIL SPLAIIHDRL AIPDAMLGSI AGFLLAASLR 
LTLLPQPNRW HAAGVGALGA LATLVKLPGL FLFALPALII VTSAATPERR HQQWALLRTV 
LIMTLLAPAS FAPFNYGGAE NHKVGVFNLA LQIERLTDNV RQIGEWLALT LPLPTLALIG 
LGLSQRPTRR LILTLVAAAC VFCMALATIG SVLYPRYILP AWPLLLVVAG VGLSRLCHLP 
VALRGAGIAI ALINAIWGSF FAIQYAQNPA QAPLTTADRH QYIETWTAGY HLDEITLLLH 
TEAEQKGDIA LLSPLQPRLI HIGPKVYLNG DPRISFVDVD VASDNARQLI NEITTQRTVY 
VTLDAEEVVA FDIERRFPEL KIIREWRNPH SDMAFYLYVW SP