Gene Rcas_3894 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3894
Symbol
ID	5541400
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	5098013
End bp	5099143
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	59%
IMG OID	640896005
Product	permease
Protein accession	YP_001433948
Protein GI	156743819
COG category	[R] General function prediction only
COG ID	[COG0701] Predicted permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.932895
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTAGCC GCACCGTTCC GCCTATGTCA CGCGCCTCGT TTGAGCGCAT TGTGCCGGTT 
GTCTCGCTGG TTGTGCTTGC CTTGATCATC GGTCAGTCGG TGGTGCAAAG CGTCAGCGCC 
TGGCTTTCCG GCGCAGAAGC GAAGCATATC GTCCCGGTCT TCGAGGCGCC AATCGCCAGT 
GCAGGCAAAG CATTGGGCGC CGCTCTCACC TCCTGGATGC CCGCCTGGAG CATTCCCACA 
CCGTTTGGTC CACTCGATGT CAAGCATACG GCGTCGTACA CGATCTATGA ATGGTTCAAA 
CTGCCAATCA TTCTCTTTCT GACGACCTAC GGCATGACAC TGTTGCGCCT GAGCATCAGC 
ACCCGATGGA TTGAACGCTC CATCGGGCGG AATGATCTGC TGGGGGCTTC GGGTGGTGCG 
CTGCTGGGCA TATTCACACC GGTCTGCTCC TGCACCGTCA CCAACATCTA CGCCGGCATC 
GTTGCCGGCG GCGCAAGCCA GCGCGCCTCG TCGGCGTTTC TGTTTGCCAG CCCGGCGTTG 
AATGAGTTCG CCATTCTTTT TATGTTTGTG ATCGTCGGAC CGTTCGGCGG GCTGGTCTAT 
GTGCTGGCAG GTTTTGCCGC CGCGCTGGCG ACCGCGTATC TTGCGCCGGT TCTGGGGCTG 
GATCCGGCGC GTTTTGTGCA GCAGGTCGTT TCACCGCACT TATGCGGTAC GATTGCCCGG 
GAGAGCATTC TGGTTCGTGC GCACCGCGAG GCGTGGGCAT TGTTTAAGCG ATTGTTTGGC 
GTTGTCCTGT TCAGTGGGTT GCTGGCAGGC ATTCTGGTCA ATTTTAACCT GACGCTGGTA 
GAGAGTCTGA AACAGGCGGG CGCTGCGTGG TGGGGACCGC TCATCGCCAC CGTGCTCGGT 
CTGCCGCTCG ACATTAATGC CGCTTCAACG GCGCCGATTC TGGTGGCATT GCACCAGATT 
GTGCCGATTG GAACACTGGT GGCGGCAATG ATGGCAACGA CCGTCTCCTC AATCCCGGAG 
TGGGCGATGC TCAATCGTCT GATTGGAAAG GCGGGAGCGA TCAAAGTCGT GCTCTGGTAT 
GCAACCTATG TGGCGCTCCT GGGGTTGCTG CTCAACTGGT TGTTTGCCTG A

Protein sequence

MFSRTVPPMS RASFERIVPV VSLVVLALII GQSVVQSVSA WLSGAEAKHI VPVFEAPIAS 
AGKALGAALT SWMPAWSIPT PFGPLDVKHT ASYTIYEWFK LPIILFLTTY GMTLLRLSIS 
TRWIERSIGR NDLLGASGGA LLGIFTPVCS CTVTNIYAGI VAGGASQRAS SAFLFASPAL 
NEFAILFMFV IVGPFGGLVY VLAGFAAALA TAYLAPVLGL DPARFVQQVV SPHLCGTIAR 
ESILVRAHRE AWALFKRLFG VVLFSGLLAG ILVNFNLTLV ESLKQAGAAW WGPLIATVLG 
LPLDINAAST APILVALHQI VPIGTLVAAM MATTVSSIPE WAMLNRLIGK AGAIKVVLWY 
ATYVALLGLL LNWLFA