Gene Rcas_2888 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2888
Symbol
ID	5540377
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	3745802
End bp	3747082
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	61%
IMG OID	640895008
Product	hypothetical protein
Protein accession	YP_001432968
Protein GI	156742839
COG category	[R] General function prediction only
COG ID	[COG1721] Uncharacterized conserved protein (some members contain a von Willebrand factor type A (vWA) domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACGCTC TGCGTCCTAT CGCGCTGGTT GCGCTTGCAC TGCTGCTCTT CGTGGCGGCG 
CACGGCACGG GGATCGATCT GTTTTTCCAA CTGAGCTACC TGTTAGTTGG CATTGTGATT 
GTAGCGTACC TGTGGGCATG GCTCAATCTG CGTGGTTTGA GCGTGCGGCG CGAGGTTTTC 
ACCCATCGCG CACAGGTCGG AGATGTGGTG CGCGAGCGGA TGACGCTGGT CAACCACTGG 
TTCCTGCCCA AACTCTGGAT CGAGGTGATC GACCGTTCAA ACCTGCCCGA CCACAGTGCC 
GGTTTCGTCG CGTATCTACC AGGATACGAT CAGCGGCGCC AGGTTATTCG CACCACCTGC 
ACCATGCGCG GGAAGTTCCG GTTGGGTCCG GTGACGCTGG TAAGTAGTGA CCTGCTGGGT 
CTGTTTCGTT TCCAGCGCGA TATTCCAGGC GATAACGAGA TTCTGGTCTA CCCGCGCACC 
GTTCCGCTGC CAGGTTTCGT GCTGCCCGGC GCAGAATTGC CGGGTGGCCA GGACCTCCGG 
CGACGCACGT ACCACGTAAC ACCAAATGTC GCCGCCATTC GCGACTATCA ACCCGGCGAC 
GGTTTCAACC GCATTCACTG GCGGAGCACA GCGCGCCTGG GCAGGTTGAT GGTGAAGGAG 
TTTGAACTCG ATCCGACTGC CGAGGTTTAT GTGGCGCTCG ATATGCATGA ATATGTGCAG 
CAGGCATGGC GGCCCGTAGA AAGAACTTCG GGCAGGCAGT TCCGGCGAAC CACCGAGTCG 
ACCGAGGAAT ATGCGGTGCA TGCCGCAGCA TCGATTGCGC GTCATGTGCT CGAGCAGAAT 
CGTGCCGTGG GGTTGATCGC CTGGGGACAG CGCCGCGAAG TCATTCCGCC TGAGCGCGAG 
GCGCGGCAGT TGTACAAAAT CCTGGAGGCG CTGGCGGAAC TGCGCGCCTA TGGGTCTGCG 
TCGCTGGCGG AAGTGTTGAG CGCCGAAAAC GCACGCTTCG GGCGCAACTG CACGCTGGTG 
GTGATTACTC CGTCGCTGGA TGAGCGGTGG GTTACAGGAG TCCAGCACTT GCGGTATCGA 
GGGGTGCGTA TCGTTGCGAT TCTGATCGAT GCGGAGTCGT TCGGCGGTGG GCGCAGCAAC 
GAGTCGATCC GTGGACGCCT GGCAGAACTG CGCGTGCCAA CCTGTGTCTG GCAACGCGGA 
CAACCGCTGA CGACGGCGCT TGCTCAGACC GCCGCAATGG GTCTTCACCA TGCGGGAGCG 
CCGCACGCTC GCCCATCGTG A

Protein sequence

MHALRPIALV ALALLLFVAA HGTGIDLFFQ LSYLLVGIVI VAYLWAWLNL RGLSVRREVF 
THRAQVGDVV RERMTLVNHW FLPKLWIEVI DRSNLPDHSA GFVAYLPGYD QRRQVIRTTC 
TMRGKFRLGP VTLVSSDLLG LFRFQRDIPG DNEILVYPRT VPLPGFVLPG AELPGGQDLR 
RRTYHVTPNV AAIRDYQPGD GFNRIHWRST ARLGRLMVKE FELDPTAEVY VALDMHEYVQ 
QAWRPVERTS GRQFRRTTES TEEYAVHAAA SIARHVLEQN RAVGLIAWGQ RREVIPPERE 
ARQLYKILEA LAELRAYGSA SLAEVLSAEN ARFGRNCTLV VITPSLDERW VTGVQHLRYR 
GVRIVAILID AESFGGGRSN ESIRGRLAEL RVPTCVWQRG QPLTTALAQT AAMGLHHAGA 
PHARPS