Gene RoseRS_4040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_4040
Symbol
ID	5211023
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	5062560
End bp	5063945
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	59%
IMG OID	640597628
Product	hypothetical protein
Protein accession	YP_001278334
Protein GI	148658129
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGTCT TTCGTCTGGA TCGAAGGAGC AAAGCAGTGA AGATTCCTCT CTCCTGGCGT 
CAGGTAGCGC TTATTGCGCT GCTCGGCGTG CTGACGCCAC TCTTCGCCGC GTGCGGCGGC 
GCGCCTGCAT CACAGGGAAC CACGCTGCCG ACCGCGGTTA TCAATGCGCC AACGTTGCCG 
CCTGTGGCGG CGACGGTCAA TCCTATCTCT CCAGTGCCCA CCGCAACCTC AGATAATCCA 
GCGCCGACGC CTGTTCCTCC ATCGCCCACG GCAGCGCCGG TTGAGTTGAC ATTCCCGCTC 
CGCTTGCCGC AGCCGGAACA CGGAGTCGTG GCGCACCTCT ACTACACCGA TCGTGAGCGG 
GTGTTGACGC TCACCGAAAT TGCCGGGTAT ACCTGGGTGC GCCAGCAGAT CCAGTGGAAG 
GACATCGAAG GACCGGAACC GGGCGATTAC AAGTGGGGCG AACTCGACAA CATCGTCGAC 
GACGTTGCCG CGCGAAACCT CAATCTGCTG ATCAGCATCG TCAAGGCGCC ATCGTTCTAC 
AATCCGACGA ACGGCTTGCC GCGTGATCCG GTGACTATGG GGAACTTCGT CGAGGCAATG 
GTTCGACGGT ATGGCACAAA GATCAAGGCG ATCGAGATCT GGAACGAACA GAATCTGGCG 
GTCGAAAACG GCGGCCGCGT GACTGTCGAG GATGCCGGGC ATTATGTCGA AATCCTGGTC 
GAATGCTACA AGCGGATCAA AGCAGTCGAG CCGCGCATTT TTGTGCTGTC GGGCGCACCC 
TCGTCAAGCG GCGTTGACGA GCCGTCGCTG GCAGTCTCCG ACGAGCGTTA CTACCGGGCG 
ATGTATGAAT ATAAAGGCGG GCTGATCAAG GACTATTTCG ATGCCCAGGC AGTGCATCCC 
GGCGGCGCCG CCAATCCGCC CGACACCCTC TGGCCCGAAA AGCCGAGTTA CATCCAGGGA 
TGCAAACCGG CGCCAGATCG CTGCTGGAAC GACCATCCGA CGCACTACTT CCGCCATGTC 
GAGAATGTGC GCAAGTTTAT GGTCGAGGAG GGGGTTGGCG ATCATCAAAT CTGGATTACC 
GAATTCGGAT GGGCGACGCC GAACAATACT CCCGGCTATG AGTTCGGCAA CTATGTATCG 
CTTGAACAAC AGCGCGACTA TATCATTACT GCAATGAAGC GCATCGATGA ACTCTATCGC 
GCGCCGGACG GCAAGCCGTG GGTGGGGGTT GCATTTCTGT GGAATATGAA CTTCGCAGTA 
CTCTGGGGAG CGCAGGGCAA TCCGGATCAC GAGCAGGCGT CGTTTGGCAT CCTGAACCCC 
GACTGGAGTC CACGCCCCTC GTTCCTGGCG ATCCAGAGTT ACCTGGCGGA GCGCAAACGG 
CGGTGA

Protein sequence

MAVFRLDRRS KAVKIPLSWR QVALIALLGV LTPLFAACGG APASQGTTLP TAVINAPTLP 
PVAATVNPIS PVPTATSDNP APTPVPPSPT AAPVELTFPL RLPQPEHGVV AHLYYTDRER 
VLTLTEIAGY TWVRQQIQWK DIEGPEPGDY KWGELDNIVD DVAARNLNLL ISIVKAPSFY 
NPTNGLPRDP VTMGNFVEAM VRRYGTKIKA IEIWNEQNLA VENGGRVTVE DAGHYVEILV 
ECYKRIKAVE PRIFVLSGAP SSSGVDEPSL AVSDERYYRA MYEYKGGLIK DYFDAQAVHP 
GGAANPPDTL WPEKPSYIQG CKPAPDRCWN DHPTHYFRHV ENVRKFMVEE GVGDHQIWIT 
EFGWATPNNT PGYEFGNYVS LEQQRDYIIT AMKRIDELYR APDGKPWVGV AFLWNMNFAV 
LWGAQGNPDH EQASFGILNP DWSPRPSFLA IQSYLAERKR R