Gene Sare_3253 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3253
Symbol
ID	5703735
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	3746405
End bp	3747382
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	75%
IMG OID	641272681
Product	hypothetical protein
Protein accession	YP_001538048
Protein GI	159038795
COG category	[R] General function prediction only
COG ID	[COG1721] Uncharacterized conserved protein (some members contain a von Willebrand factor type A (vWA) domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.584658
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.947006
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCTCAC CTGCCCGTCG GCCCCCCGAC GCCACCCCCC GCGATCGCAC CGAAGCCGTC 
CTGTCCCGGC TGCACCTGCT CGTCACCCGC AAGCTCGACG GCCTGCTCCA AGGCGACTAC 
GTCGGCCTGC TGCCCGGTCC CGGCAGCGAG GCGGGGGACT CGCGCGAGTA CCGCCCGGGC 
GACGATGTTC GGCGGATGGA CTGGCCGGTC ACGGCGCGCA CCACGATGCC GCATGTACGG 
CGTACGGTGG CCGACCGGGA GCTGGAGACG TGGCTCGCGG TGGACCTCTC GGCCAGTCTC 
GACTTCGGAA CCGGACGGTG GCTCAAGCGC GACGTCGTGG TGGCCGCCGC CGCGGCACTC 
GCCCACCTGA CCGCCCGGGG TGGCAACCGG GTCGGCGCGG TCATCGGCAC CGGGAGTGAG 
CCGCCTGGGG GCGGGCGGCG TGCGCCGGCA GCCAGGGGTG GCGGGTTCAC CCGGTTGCCG 
GCCCGGTCGG GCCGTCGGGA GGTGCAAGCC CTGGTCCGGG CGGTGGCCGG CACCGAGATC 
CGGCCCGGGC GCAGCGACCT CGGTGCCCTC GTCGACCTGC TGAACCGGCC ACCCCGGCGG 
CGTGGGGTGG CGGTCGTCGT CTCCGACTTC CTGGCGCCGC CGGCCCAGTG GACCCGCCCG 
CTGCGCAAGC TGCGGGTACG TCACGACGTG CTGGCCATCG AGGTGCTGGA TCCGCGTGAG 
CTGGAGCTAC CCGACGTGGG CGTCCTGCCG GTGGTCGACC CGGAGACCGG CGAGTTACAC 
GAGGTGCGGA CCGGCGACCC GCGGCTACGT CACCGTTACG CCGAGGCGGC TGCCGCCCAG 
CGGGCGGAGA TCGCCGCGGC GCTGCGTGCC GGGGGCGCCG CACACCTGAG GCTGCGGACC 
GACCGAGACT GGCTGCTGGA CATGGTGCGT TTCGTTGCCG CGCAGCGGCA CGCCCGCACC 
CGAGGGACGA CACGATGA

Protein sequence

MTSPARRPPD ATPRDRTEAV LSRLHLLVTR KLDGLLQGDY VGLLPGPGSE AGDSREYRPG 
DDVRRMDWPV TARTTMPHVR RTVADRELET WLAVDLSASL DFGTGRWLKR DVVVAAAAAL 
AHLTARGGNR VGAVIGTGSE PPGGGRRAPA ARGGGFTRLP ARSGRREVQA LVRAVAGTEI 
RPGRSDLGAL VDLLNRPPRR RGVAVVVSDF LAPPAQWTRP LRKLRVRHDV LAIEVLDPRE 
LELPDVGVLP VVDPETGELH EVRTGDPRLR HRYAEAAAAQ RAEIAAALRA GGAAHLRLRT 
DRDWLLDMVR FVAAQRHART RGTTR