Gene RoseRS_4114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_4114
Symbol
ID	5211097
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	5154725
End bp	5155924
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	62%
IMG OID	640597702
Product	hypothetical protein
Protein accession	YP_001278408
Protein GI	148658203
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGCGT CTGCCCTGCT CGCTGGCGCC GCGATGCGCC GGATTACTCC ACAACTCGAT 
GCCCGTCCGG TTTTTCTGGC GGGATTTCAG AATAACCGTC GCGCTACAGC GATTGACACC 
GACCTGTATG TGCGCGCGCT TGCGCTGCGC CTCGATGAGC GGATTGCGGT AATTGCCGTG 
TGTGACCTGA TCGGTCTCGA CCGCAGCGAT GTGCTCGATG TGCGCACTGC GCTCGATGCG 
CGCGGCATCG ATCCGTCCGG TCTGGTTGTC GCCTGCACCC ATACCCACAG CGGACCGGAT 
ACGCTGGGAT TGTGGGGACC AGACCGGTAC GTCAGCGGGG TGGATCCGCT CTACCTGGCA 
GCGGTCAAAC AGGCAATCGT CGATGCGGCA ATAGAAGCGC TGACATTCTG CTGCCCGGCG 
CGCATGCGCT GCGCAATGAC CCGTCTGCCG GGATATATCG CCAACTTCCG TGATCCGGGC 
ATTGTTGATG ATGACGTGGC GGCGCTCCAG TTTGTGAAAC TGGATGGCGA AGTGATCGCC 
ACTCTGCTGA ACCTGGCGTG CCATCCAGAA GTGCTGGACG GCGACAGCAC GCTGATCTCG 
GCGGACTATG CCGGGTATGC GTGTCGAGAA GTGGAAACGC GGGTCGGCGG AGTGGCGTTG 
CATGTTTCTG GCGCGCTGGG CGGAATGCTA TCCCCCGACA CGCGCGACCG CACCCCTGCC 
TGGGCGGAGC GCATGGGGCG CGCCTATGCC GATGCAGCAC TGGCGGCACT GGAGGCGTCG 
GCGGTGATCA ATGCTGATCG CCTGGAAGTG CGGCGCACCG AATTCGACCT GCCGCTGGTC 
AATCCGCTGC TGCTCATGGC GCAGCAGATG GGAGTATTGC GGGTGCGCCA ACCGGTGAAC 
GGTGCGATTA CAACCTCGTG CACCTTCATC GATCTCGGTG CAGCGCAGAT CATTACCGTT 
CCCGGCGAAC TGCTGCCACG GCTGGGGTTC GCAATCAAAG CCGCAATGCC CGGTCCCTGC 
AAGATTCTCG TCGGTCTGGC GGACGATGAA ATCGGCTACA TCCTGCCCGA TGACGAATTC 
GTGCCCCCCG CCGATTACCT GAACCCTGGC AGGCAGTATG AAGAGAGCAT GTCAGTCGGA 
CCGACCACTG GCTCACGCAT CCTGGCAGCG GCGCGGGAGT TGATCGGAGA TCATCCGTGA

Protein sequence

MNASALLAGA AMRRITPQLD ARPVFLAGFQ NNRRATAIDT DLYVRALALR LDERIAVIAV 
CDLIGLDRSD VLDVRTALDA RGIDPSGLVV ACTHTHSGPD TLGLWGPDRY VSGVDPLYLA 
AVKQAIVDAA IEALTFCCPA RMRCAMTRLP GYIANFRDPG IVDDDVAALQ FVKLDGEVIA 
TLLNLACHPE VLDGDSTLIS ADYAGYACRE VETRVGGVAL HVSGALGGML SPDTRDRTPA 
WAERMGRAYA DAALAALEAS AVINADRLEV RRTEFDLPLV NPLLLMAQQM GVLRVRQPVN 
GAITTSCTFI DLGAAQIITV PGELLPRLGF AIKAAMPGPC KILVGLADDE IGYILPDDEF 
VPPADYLNPG RQYEESMSVG PTTGSRILAA ARELIGDHP