Gene Rcas_3964 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3964
Symbol
ID	5541470
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	5169785
End bp	5170879
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	64%
IMG OID	640896072
Product	LamG domain-containing protein
Protein accession	YP_001434015
Protein GI	156743886
COG category	[R] General function prediction only
COG ID	[COG3889] Predicted solute binding protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.278047
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGCATG GAGTTCGTTT GCTGGCGCTG CTCGTCTGTG TGGCGTCGGG ATGGTTGCTG 
GCGTTAATGG CCGGCTCCGC ATCGCGTCCG TTGCGGGCAC AGTCGTCGGG CGGCTACGCG 
CTCCGGTTCT ACGGCAACGG CGTAAGTGAT ATCGACCGGG TGAAGGTGCG GATCGATCCG 
CAGGTTCCCG CCGATGTCGG CGGCGATTTC ACCATCGAGT TCTGGCTGAA AACGACGGCC 
GCCGTCGGCG CATGCTCGCC GGGAAGCTCC GGCGCCGGCT GGATTACCGG ACGGACGATC 
ATCGACCGGG ATGTGTATGG CAATGGCGAC TACGGCGATT ACGGCATCTC GCTGGCGGCG 
GGGCGGATTT GCTTCGGCGT GGAGCGCGGC GCGACGGGAA CGACGATCTA TGGCAGCACG 
AATGTGGCGA ATGGTCAGTG GCGACATATC GCGGTGACGC GCAGCGCGAG CAGCGGGCAG 
ATGCGCATCT TCGTCGATGG GCAACTCGAC GCGCAGGGAA CCGGTCCGAC CGGCGACATC 
AGTTACCGCG ACGGGCGCGC AACAGCGTAC CCGAACAGCG ACCCCTTCCT GGTCTTCGGC 
GCCGAGAAGC ACGATGCAGG ATCAGAGTAC CCCTCATACG CAGGGTTGCT CGACGATATC 
CGCATCTCGA ATGGGGTGCG CTACACCGGC GTCTTCACAC GCCCAACGGC GCCGCACGCC 
GTGGATGGGC AGACGGTCGC GCTCTACCGG TTCGACGAGG GAAGCGGCAC GACAATTATC 
GACTCGGCGC CGGATGGCGG CAGCCCTGGC GAGCGGCGGT TCGGTGGTTC ACCCGCCGGT 
CCGGTCTATG TCGCCGATAT ACCGTTTAGC GGAGCGCTTC CATCGGCGAC GCCAACGCGC 
ACCGTCACAC CAATCTCTGG TCCATTGCCT TCGGCAACAT CAACGCCGAC CGCAACACCA 
ACAATGACCT CGGTTGCGTT TACCGCCACG GTCACCAGTA CACCAACAAG GACTACCAAC 
CCAACGATTA CACCGATCGT TGGCATTTCT CCCCTGAAGC CGCGCGCCTT CCTGCCCTTT 
GTTCAAAAAC CGTAG

Protein sequence

MRHGVRLLAL LVCVASGWLL ALMAGSASRP LRAQSSGGYA LRFYGNGVSD IDRVKVRIDP 
QVPADVGGDF TIEFWLKTTA AVGACSPGSS GAGWITGRTI IDRDVYGNGD YGDYGISLAA 
GRICFGVERG ATGTTIYGST NVANGQWRHI AVTRSASSGQ MRIFVDGQLD AQGTGPTGDI 
SYRDGRATAY PNSDPFLVFG AEKHDAGSEY PSYAGLLDDI RISNGVRYTG VFTRPTAPHA 
VDGQTVALYR FDEGSGTTII DSAPDGGSPG ERRFGGSPAG PVYVADIPFS GALPSATPTR 
TVTPISGPLP SATSTPTATP TMTSVAFTAT VTSTPTRTTN PTITPIVGIS PLKPRAFLPF 
VQKP