Gene Sare_2404 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2404
Symbol
ID	5703688
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	2759899
End bp	2760846
Gene Length	948 bp
Protein Length	315 aa
Translation table	11
GC content	64%
IMG OID	641271882
Product	periplasmic binding protein
Protein accession	YP_001537253
Protein GI	159038000
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG4607] ABC-type enterochelin transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0899785
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00440693
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGGTTTC CCCTTCTTCA GGTCGGTCTC GCCACCACCC TCGCCCTGAC ATTGACCGCC 
TGCGGCGGCG AAGCGGGAGG GTCGGCCGAC TCGACGGCAG CGGACGAGCG CACCGTGGTC 
ATCGAACACG CACAGGGTTC GACCACGGTG CCGGTCAACC CCCAGAAGGT CATCACGTTC 
GACCTGGCGA GCCTGGACAC ACTCGACACG CTCGGTGTCC CGGTGACGGG AGTAGCCAAG 
GGCAATCTGC CGTCCTATCT CGACAAGTAC AACGGTGACG AGTATGTCAA CGCGGGCACC 
CTGTTCGAGC CCGACTTCGA AGCCGTCAAC GCCGCCGAGC CGGACCTGAT CGTCGTGGCG 
AACCGTTCGG CGAAGGCCTA CGGCGAGCTG AGCAAGATCG CCCCCACCGT CGACCTGACC 
CTCGACTGGA CGAGCTTCAA GTCCAGCTTC GTGACGAACA CCGAGAAGCT GGGAACGATC 
TTCGACAAGC AGGATGAGGT CACAGCAGCA CTCGCCGACA TCGACACGAA GATCAGCAAG 
GCAGAAGAGA GCGCCACTGA CGCAGGTCGT GGCCTGATCG TGCTCACCAG CGCCGGCGAG 
GTCACCGCAT TCGGACCAGG TTCCCGCTTC GGCTGGCTGC ATGACGAATT CGGCGTGACG 
CCCGCCATCG CCGATGTCGA GGCCGCGACC CACGGTGACC CTGTCTCGTT TGAGTTCATC 
CTGAAGACCA ACCCCGACTG GCTCTTCGTC GTCGACCGGG ACGCGGCCAC CGGTGAGGGC 
ACGAAGACCG CGCAGGAGGT TCTCGACAAC GAGGTCGTCG CCAGGACCAC CGCCTGGTCC 
AAGCAGCAGG TCGTCTACCT CGACCCGGCG CCGTGGTACA TCGTGATGAG TGGACTGACC 
GCCGTGAACC AGATGATCGA CCAGGTCACC ACCGGCCTCA CCAAGTGA

Protein sequence

MRFPLLQVGL ATTLALTLTA CGGEAGGSAD STAADERTVV IEHAQGSTTV PVNPQKVITF 
DLASLDTLDT LGVPVTGVAK GNLPSYLDKY NGDEYVNAGT LFEPDFEAVN AAEPDLIVVA 
NRSAKAYGEL SKIAPTVDLT LDWTSFKSSF VTNTEKLGTI FDKQDEVTAA LADIDTKISK 
AEESATDAGR GLIVLTSAGE VTAFGPGSRF GWLHDEFGVT PAIADVEAAT HGDPVSFEFI 
LKTNPDWLFV VDRDAATGEG TKTAQEVLDN EVVARTTAWS KQQVVYLDPA PWYIVMSGLT 
AVNQMIDQVT TGLTK