Gene Rcas_3275 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3275
Symbol
ID	5540773
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	4251750
End bp	4253009
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	59%
IMG OID	640895393
Product	von Willebrand factor type A
Protein accession	YP_001433344
Protein GI	156743215
COG category	[R] General function prediction only
COG ID	[COG2304] Uncharacterized protein containing a von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.112036
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGGCG AGGTTGCCAT TCGCGCATCG CTGGCGCGTC CGTATCTGAC GGCAGCGACG 
ATGCCGCAGG TTGCGTATCT GCTGATCGAA GTCACGCCTG GTCAGATCAT GACACAAGTG 
CGAGCGCCGG TCAATGTCTG TTTTGTCATT GATCGGAGCG GCTCGATGAA GGGCGAAAAG 
ATCGACCGGG TGCGACGCGC GACGATTCGC GCAATTGAGA TGCTCGACGC ACAGGATGTC 
GTCTCGGTCG TGATCTTCGA TCATCGCACC GAGGTCCTGA TCCCTGCCAC GCCGGTCGCC 
AAACCCGCAG AACTGGCTGA TCGCGTCAAT CGTGTGCGCG ATAGCGGCGG AACCCGGATT 
GCGCCGGCTA TCGAGGCAGG TCTGCGCGAG ATCGATAAAG GACCGTCGCA CATGGTGCGT 
CGCCTCATCC TGCTCACTGA CGGTCAGACC GAGAGCGAGT CCGACTGTCT GCGACGCGCC 
GAGGATGCCG GACGGCGCAA CGTGCCGATC ACGGCGCTTG GCGTCGGCAA GGACTGGAAC 
GAGGATCTGT TGATCGAGAT GGCGAATCGT TCGGGAGGAA CGGCAGACTA TATTGATCGT 
CCAGAAAAGA TCGTCGATTA CTTCCAGAAT ACCATCCAGC GCGCGCAGGC GACGACGGTG 
CAGAATGCGA ACGTGACGCT ACGATTTGTG CAGGGAGTAT TGCCGCGCGC CGTGTGGCAG 
GTCTACCCGC TTATCACCAA CCTCGGTTAC CGCCCCATTT CTGATCGCGA CGTCAGTGTG 
CCGCTTGGTG AACTGGAAAC CGGGAGCGGA CGCACCCTGC TTGTCGAAGT GCTGGTCGAG 
CCGCGACCAT CCGGTGAGTA TCGCATCGCT CAGGTCGAGG TAAGTTATGA TATTCCGCTG 
CTGAATCTGC ACGGTGAGAA GAGTCGCGCC GACATCATGC TTTCCTTTAC GACTGATGCC 
GGGCTTGCTG CGCAGGTGAA TCCGAATGTG ATGAATATCG TCGAGAAAGT CAGCGCCTTC 
AAGTTGCAGA CGCGCGCCTT GCAGGACCTC GCTGCCGGCG ATGTCGCGGG AGCGACCCAG 
AAGCTGCAAA GCGCCGTGAC CCGGTTGCTC AACCAGGGCG AAGTCGAACT TGCGCAGACG 
ATGGAGCGTG AGATTCAGCA TCTGCAACAG ACCGGCAAAC TTTCCAGCGA AGGGCAGAAG 
ACGATCAAGT TCGGCGTGCA GAAGACGGTG CGGTTGAGCG ACATCAAGCA GGAGGAATAG

Protein sequence

MAGEVAIRAS LARPYLTAAT MPQVAYLLIE VTPGQIMTQV RAPVNVCFVI DRSGSMKGEK 
IDRVRRATIR AIEMLDAQDV VSVVIFDHRT EVLIPATPVA KPAELADRVN RVRDSGGTRI 
APAIEAGLRE IDKGPSHMVR RLILLTDGQT ESESDCLRRA EDAGRRNVPI TALGVGKDWN 
EDLLIEMANR SGGTADYIDR PEKIVDYFQN TIQRAQATTV QNANVTLRFV QGVLPRAVWQ 
VYPLITNLGY RPISDRDVSV PLGELETGSG RTLLVEVLVE PRPSGEYRIA QVEVSYDIPL 
LNLHGEKSRA DIMLSFTTDA GLAAQVNPNV MNIVEKVSAF KLQTRALQDL AAGDVAGATQ 
KLQSAVTRLL NQGEVELAQT MEREIQHLQQ TGKLSSEGQK TIKFGVQKTV RLSDIKQEE