Gene RoseRS_2010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_2010
Symbol
ID	5208972
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	2498416
End bp	2500002
Gene Length	1587 bp
Protein Length	528 aa
Translation table	11
GC content	69%
IMG OID	640595617
Product	hypothetical protein
Protein accession	YP_001276346
Protein GI	148656141
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.00501978
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCTGAGA TGCCACGCTC CCATGACCTC AAAGTCGAAC CGCGCGCGCT GGCGCGCTTC 
ATCCCGCGCA CGGTTCCGCC TGCGTTGCGC CTGCCGCCGG AGATCAACCG CCTCGACCTG 
CTGCACCAGG AGGGCGTCGA GGCGCTGCTG CGCGAACTCT ACAATCTGCT GCGCGACCAG 
GGCATCACCT GTGATGTTGA GCCGCCCGCC CCGGCGATGG CGGTGCGCCA GCCGATCCGC 
ACCATCGACA CGACTCTGAC TGAGAAGCGC GGTACGTGTC TCGACCTCTC GCTCCTCTTC 
TGCGCCGTCT GCCTGGCGCA CGACCTGGCG CCGCTGCTGA TTGTGCTGGA GGGGCATGCG 
TTTGTTGCTG TTACGACCGG ACGAACGCTC CAACAACCGC ATGGCGAAGG CATGCCGGCG 
TTCGAGCGAG GCATGCTCGC CAGTTTCGAC GCACTGCGCG ACCAGGTTCC CCGGCTCTAT 
CTGCCGGTCG AGTGTACCGG TTTCGCTGCC GGGGCCGGTC TGAGCCGGGA GTATCCCGAA 
GGGCGCGGGC GCGAACGGCG CGATGGGTGC ATGTCGTTTG ATCGCGCCGT GCGGGCCGGC 
GAGGAATACC TCAATGCCCA CATCGCGCCC GCCGGCGCGA CCCCCGGCGC AGCGCAGCGC 
GCCTTCCTGT ACGCGCTCGA TATTGTAACG TTGCAGGATC GGTACGGCTT CATGCCGGTC 
GGCGACACGC TGCCGGGAGA TACGCGGGTG TACCTGGACT CGGCGCACGC CGAAGGCGGC 
GCTGCCAGCG TTCGCAATCA GGGAGCGGGC GAAGCGGCGC CGTCCGCGCT GCCTGATGCC 
GACCGGCTCT ACCAGCGTTC GGCGCATGCC GAAGGCGGCG GTGATGCGCG GGTGGAGAAC 
CAGGGCGGCA GCGTTGCACC GCCACCGGCA AAGGCACGTC GCATCTACAG CGGTTCGGCG 
CACGCCGAAG GCGGCGGTAA TGCCACCGTG CTCAACAACG CGCCTCAACC TGTGGCGCGC 
GTTGAACCGG CGACGGTGCT GGCGGTGTAT GCTGCGCCGC CCGGCAGCGC GCTGCTGCAC 
TGGGAACGCG ATGTGCGCGC GCTGGGCAAG GCGCTTGCGC CCTACCCCGA CCGCTTCCGT 
CTCGACGTTG TGCCGCTGGC GACGCCGGAA GACGTGCAGC GCGCGCTGGT GCAGTTTCGC 
CCGCGCTATC TGCATCTCTT CGCCCATGGC GCAGTTGATG GCATCCTGCT CGATGACGGC 
GAGGGCGGGC GTGGCTGGAA ACTCCCTTAC CCGCTGCTGG CGGAAATGGT GCGCGCCACG 
CCTGGCCTCC GCTGCGTCCT GCTCAGCGCC TGCGACTCGG CCTATGCCGC GAGTGCAACC 
GGCAGCGGCG AGCCGTACCT GATCGCCATG CGTGGCCAGG TCAGCGTCGA TGCCGCGATC 
GCCTTTGCCG GGGGGTTCTA TGAAGCCCTC GCCGCGCGCG AGGACACTCC GATTGAAGCG 
GCCTTCGCTC AGGGGCTGAT CCGGCTGAAG CTGATTGCGC CGCTGGATGC GGAGGTTCCG 
CTGCTGGCGG CGGGCTGGCG CGGGTGA

Protein sequence

MPEMPRSHDL KVEPRALARF IPRTVPPALR LPPEINRLDL LHQEGVEALL RELYNLLRDQ 
GITCDVEPPA PAMAVRQPIR TIDTTLTEKR GTCLDLSLLF CAVCLAHDLA PLLIVLEGHA 
FVAVTTGRTL QQPHGEGMPA FERGMLASFD ALRDQVPRLY LPVECTGFAA GAGLSREYPE 
GRGRERRDGC MSFDRAVRAG EEYLNAHIAP AGATPGAAQR AFLYALDIVT LQDRYGFMPV 
GDTLPGDTRV YLDSAHAEGG AASVRNQGAG EAAPSALPDA DRLYQRSAHA EGGGDARVEN 
QGGSVAPPPA KARRIYSGSA HAEGGGNATV LNNAPQPVAR VEPATVLAVY AAPPGSALLH 
WERDVRALGK ALAPYPDRFR LDVVPLATPE DVQRALVQFR PRYLHLFAHG AVDGILLDDG 
EGGRGWKLPY PLLAEMVRAT PGLRCVLLSA CDSAYAASAT GSGEPYLIAM RGQVSVDAAI 
AFAGGFYEAL AAREDTPIEA AFAQGLIRLK LIAPLDAEVP LLAAGWRG