Gene RoseRS_2165 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_2165
Symbol
ID	5209127
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	2665494
End bp	2666699
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	62%
IMG OID	640595766
Product	VWA containing CoxE family protein
Protein accession	YP_001276495
Protein GI	148656290
COG category	[R] General function prediction only
COG ID	[COG3552] Protein containing von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGAGT TAGAACCACT GATTCCCCAC GGGAACCTGA TGACGCATGT GGTTGCGTTC 
GTGCACCTGC TGCGCAGCAC CGGCATCAAA GTCAGCAGCG AACAGACCAT CGATCTGGCG 
CGGGCGCTGG AGCATGTGCC GATTGTGGCG CGTGGGGATT TTCGCGCAGC TGCGCGCTGT 
ACCCTGATCT GCCGACGCGA AGATCTGCCG ATGTTCGATG CTGCGTTCGA TTTCTACTGG 
CGCACGCAGT CAGGGTTTGA TCCGTTGATG CTGGCGATCC CGGTGGTCAA GATGCCGCCG 
AAACCGCTGC GTCTGCCGCG CCGACCGCGC AGCCAGGGCG ATGGACACAA TGAGCCGGAT 
CGTCATGAAG AACAGCAGGA AGAGAAGGTT GGCTTTACGC TCACCTTTAC GGCTGCTGAG 
ACGTTGCGCA CCAAAGACTT CGGCAACTTC AGTTACGAAG AGGTGCAGGC GTGCAAGGAG 
TTGCTACGCA CACTCGAGTG GCGCATCGAG CCGCGTCGCA CCCGTCGTCG TCGCCCGGCA 
GTGCGCGCCG GCGAGATCGA TATGCGCCGC ATCCTGCGCC GCAACCTGCG CCACGGCGGC 
GACCCGATTG AGTTGACCTT CCGCGAGCCG CGCTATCGGC AGCGTCCGCT CGTCGTGCTG 
TGCGACATCA GCGGTTCGAT GGATCGCTAC AGTCGTATCC TGCTTCAATT CGTGCATACT 
ATCTCGAACG GCTTGCGTGA CGTGGAAGCG TTCGTATTCG GCACGCGCCT GACGCGCATT 
ACCCGTCTGT TGCGTGAACG CGATATCGAT GAAGCCATCG CAGCCGTCAG CAAACATGTG 
GTGGACTGGT CGGGCGGGAC GCGGATTGGC GAGGCGGTCA GGCACTTCAA TTACTACTGG 
TCGCGCCGGG TGCTGGGGCG CGGTCCGGTG GTGTTGCTCA TCAGCGACGG ATGGGATCGC 
GGCGATCCGC AGTTGCTGGG GCGTGAAATG GCGCGGCTGC AACGTTCATG CTACCGCCTG 
ATCTGGTTGA ACCCGTTGCT GGGGAACCCG CGCTATCAAC CGCTCACCCA GGGGATGCAG 
GCGGCGCTGC CGTTTGTCGA TGACTTTTTG CCGGTGCACA ACCTGGTAAG CCTGGAGCAA 
CTCGGCGCAA AACTGGCGAT GCTTGGCGCG CGCCGCCCTG AGCGACGCCA GCGGATTGGA 
ACCTAG

Protein sequence

MDELEPLIPH GNLMTHVVAF VHLLRSTGIK VSSEQTIDLA RALEHVPIVA RGDFRAAARC 
TLICRREDLP MFDAAFDFYW RTQSGFDPLM LAIPVVKMPP KPLRLPRRPR SQGDGHNEPD 
RHEEQQEEKV GFTLTFTAAE TLRTKDFGNF SYEEVQACKE LLRTLEWRIE PRRTRRRRPA 
VRAGEIDMRR ILRRNLRHGG DPIELTFREP RYRQRPLVVL CDISGSMDRY SRILLQFVHT 
ISNGLRDVEA FVFGTRLTRI TRLLRERDID EAIAAVSKHV VDWSGGTRIG EAVRHFNYYW 
SRRVLGRGPV VLLISDGWDR GDPQLLGREM ARLQRSCYRL IWLNPLLGNP RYQPLTQGMQ 
AALPFVDDFL PVHNLVSLEQ LGAKLAMLGA RRPERRQRIG T