Gene RoseRS_3058 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_3058
Symbol
ID	5210026
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	3840593
End bp	3841705
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	58%
IMG OID	640596650
Product	ABC-type sugar transport system periplasmic component-like protein
Protein accession	YP_001277372
Protein GI	148657167
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0062327
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACTCGCC GATTCTTCGC ACTGTTCACA CTACTGATTG CAATTGCTTC ACTGATCGCA 
GCATGCGGCG GCGCTCCAAC AACGACCGCT CCGACCGCTG CACCGGCAGG GCAACCGACG 
GCGGCGCCGG AAGGCAAAAA ATTCACCATC GGCATCTCTA ACCCGTTCAT CAGCAGCGAA 
TACCGCACCC AGATGATCCA GTCGTTGATC GAGGTCAACA AGGAATACAT GGAGCGGGGT 
ATCACGAATG AACTCGTGAT CGAGAGCGCC GATACCGATG TCGCCGGTCA GATCCAGCAG 
TTGCAGAATC TGATCAACAA GGGCGTTGAT GCCATCCTGG TGAATCCCAG CGATGTCAAT 
GGTCTCAACG ACACCCTTCA GGAAGCCATC AACAAGGGGA TCATCGTCAT TTCCGTCGAT 
CAGGAACTCA ACACCCCCGG CGTCTACAAC GTCGGCATCG ACCAGAAAGA GTGGGCGAAG 
ATCTCCGCCC GCTGGCTGGC GGAGAAGTTG GGTGGTCAGG GAAACATCGT GCTGATCGAA 
GGCTTCCCCG GACACCCGGC GAACGTGGCG CGCATGGACG GCGTCGAGGA GGTGCTCAAG 
GAGTATCCGG GCATCAAGGT GCTGGGGCGT GAAACCGGGA AGTGGGACGA AGCGACCGGT 
CAGCAGGTGA TGTCAAACTT CCTGGCGTCG TTCCCTAACC TCGATGGCTA CTGGACTCAG 
GACGGCATGG CGATCGGCGC GATGCAGGCG GTGATGGCGG CGAACCCGCC GAAGTGGCCC 
ATCCTGGTTG GCGAAGGACG CTGCCAGTTC TTGCAGTTGT GGGATCAGCG CTTGAAGGAA 
GACCCCAACT TCGAGACGAT TGCTGTCGCC AATCCGCCCG GCGTCTCGCC GACCGGTCTG 
CGGATCGCCG TCAATATGCT GATGGGCAAG CAGGTGGATA AGAGTAAACT GGGAGGTGCG 
AACGGGTTGT CGTTCGTCAT TCCGGTGCCG GTGATCGTGA CGAAGGACAA CTTCCAGGAA 
GTCTTCACCA CTATGTGCAA GGACAAGCCG GCCACCTACC TGCTCGACGG CATTATGACC 
GACGAGGAAG TGCAGCAGTT CTTCCTGAAG TAA

Protein sequence

MTRRFFALFT LLIAIASLIA ACGGAPTTTA PTAAPAGQPT AAPEGKKFTI GISNPFISSE 
YRTQMIQSLI EVNKEYMERG ITNELVIESA DTDVAGQIQQ LQNLINKGVD AILVNPSDVN 
GLNDTLQEAI NKGIIVISVD QELNTPGVYN VGIDQKEWAK ISARWLAEKL GGQGNIVLIE 
GFPGHPANVA RMDGVEEVLK EYPGIKVLGR ETGKWDEATG QQVMSNFLAS FPNLDGYWTQ 
DGMAIGAMQA VMAANPPKWP ILVGEGRCQF LQLWDQRLKE DPNFETIAVA NPPGVSPTGL 
RIAVNMLMGK QVDKSKLGGA NGLSFVIPVP VIVTKDNFQE VFTTMCKDKP ATYLLDGIMT 
DEEVQQFFLK