Gene Rcas_0655 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0655
Symbol
ID	5538118
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	862054
End bp	863442
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	62%
IMG OID	640892812
Product	VWA containing CoxE family protein
Protein accession	YP_001430798
Protein GI	156740669
COG category	[R] General function prediction only
COG ID	[COG3552] Protein containing von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCAGC GGGTTGTCGA TTTTATCCAT GCCCTGCGCG CAAAAGGAGT GCGCATTTCG 
CTCGCCGAAA GTATCGACGC AATGCGTTGC GTCGAAATTG CTGGTGTCGC CGATAAACAA 
TTCTTCCGTT CGGCGCTGCG CGCGTCGCTG GTGAAAGAGC CACGCGACCT GCCGACGTTC 
GATGAACTCT TCCCGCGCTT CTTCGGTCTC GATGCCCCGC CGCCGCTCCA GCAGCCCGGC 
GGTGGGATGT CCCCCGAAGA GCGCGAACAA CTGGCGCAGA TGCTGCAACA GATGCTGGCA 
TCGCTCACAC CAGAGCAACT CCGGCGTCTG TTCGAGATGA TGATGACCGG GAAGGGCATG 
AGCGGCAGCC AGATGCGCCA GTTCATCGAC GAGAACACGA CCGCTACACA GATGACGACC 
GGCTTCCAAC CGTGGGCAAC GCGTCGCGCG CTGCGTGAAT TACAGTTCGA CCGCCTGGAG 
CAGTTGCTTC AGGAACTGAT CGAGAAACTG CGCGAAGCGG GAGTCGGCGA GGCGGCGCTT 
CGGCAACTGG AACAGGAAGC GCGCGAGAAC CGCGCGGCGC TGGCGCAGCA GATCGGCAAC 
GAAGTGGGGA ATGGGCTGCA ACAGCGCGAA GCCGAAGAAC GCCGTCGCCG CCCTGCCGAA 
GATTTGCAGG ATCGTCCATT CGAGGAACTG ACGTACCGGG ACGATGATGA GATGCGCGCC 
GTGATTAACC GCCTGGCCGC ACAGTTGCGC ACGCGCGTCG CGCTGCGGCA GAAACGCGCC 
AGCAAGGGCG CCCTCGATGC CAAGAGCACC ATCCGCGCCA ATCTGCGCTA CAGCGGCGTG 
CCACTCGACA TTCGCCACCG CCGCAAACAC CTGAAGCCGC GCATTACCGT CATCTGCGAT 
GTCTCCGGAT CGATGCGCGC TGTCACCGGC TTTATGCTGA TGCTCGTCTA TGCGTTGCAG 
GATCAGATCA GCCGCACCCG CCCCTTTGTG TATTACCGCA CCATTGCCGA TGTGCAGGCT 
GATTTTCAGC AACTGCGCCC CGAAGATGCG ATCCGCGTCG TGCCGGAGCG GGTGCAGGGT 
GGTCCCTGGC AGACGAGCCT GGGGGCATGT CTGGCGACAT TCACGCGCGA TTATCTCGAC 
GCGGTTGATC GCCGCACCAC GGTGATCTTC CTCGGCGATG GTGATGATCA TCTGTCGCCG 
CCGAACCCGC GCGCGTTCGA GACCATCAAG CGCCGTGCAC ACCGCGTCGT CTGGTTTAAC 
CCCGAACCGC CCTATCGCTG GGGGCGGGAA GACAACCACA TGCACATCTA CGCTCCCATG 
TGCGATGCGG TGCATCACGT GAGCAACCTG CGTCAGTTGG TTGCGGCTGT GGACGGGCTG 
TTTTCGTAA

Protein sequence

MDQRVVDFIH ALRAKGVRIS LAESIDAMRC VEIAGVADKQ FFRSALRASL VKEPRDLPTF 
DELFPRFFGL DAPPPLQQPG GGMSPEEREQ LAQMLQQMLA SLTPEQLRRL FEMMMTGKGM 
SGSQMRQFID ENTTATQMTT GFQPWATRRA LRELQFDRLE QLLQELIEKL REAGVGEAAL 
RQLEQEAREN RAALAQQIGN EVGNGLQQRE AEERRRRPAE DLQDRPFEEL TYRDDDEMRA 
VINRLAAQLR TRVALRQKRA SKGALDAKST IRANLRYSGV PLDIRHRRKH LKPRITVICD 
VSGSMRAVTG FMLMLVYALQ DQISRTRPFV YYRTIADVQA DFQQLRPEDA IRVVPERVQG 
GPWQTSLGAC LATFTRDYLD AVDRRTTVIF LGDGDDHLSP PNPRAFETIK RRAHRVVWFN 
PEPPYRWGRE DNHMHIYAPM CDAVHHVSNL RQLVAAVDGL FS