Gene Sare_4212 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4212
Symbol
ID	5707950
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4780716
End bp	4781726
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	64%
IMG OID	641273631
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_001538984
Protein GI	159039731
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0601] ABC-type dipeptide/oligopeptide/nickel transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0203123
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGCGCT ACGTCATCCG ACGGTTGCTC CAGTTCATCC CGACCGTGCT GGGCACCATG 
TTCCTGCTCC ACTACATGAC CTCGCTGGCG ATCCAGTTCA GCGGGAACCC GGTCCTGGCG 
CTCTTCGGCG ACCGGACCCC GCCGCAGTCT GTGCTTGACG CGATCACCGA GCGGCTCGGT 
TACTCCGACC CCTGCCTCGA CCAGAGGGGC AATCCCTGCC TCGGGCTCTT CGCCGATCGG 
GTGAGCAATA TTTTCCTTCA CTTTGACTTC GGCATCAACC TCAATCGGGA AGAGGTCACC 
GACATGGTGG CCAACGCCCT CCCGTTCACC CTGAAGCTGT TGGTGATCGC GATCGTCTTC 
GAGGCGGTCG TCGGTATCGC GGCCGGGGTG TGGGCGGGTC TGCGGGGCGG CAGCTTCGCC 
GACAACCTGG TGAAGATCAG CACCGTTTTC GTGATCTCTG TGCCGATCTT TGTGCTCGGC 
GTCGTGGTGC GGGAGTTCGT CGGGGTCAAG TTCGGCAACA TTCTGCGTGA TCAGGAGTGG 
ATTCCGGACG TTATCGCGAC GGGCGTCTTC AGTCCCGGCT TCAAGCCGGA CTACCCCTTG 
GCCAGCCTGT TGATCCCGGG CATGGTTTTG GGCGCGGTCG CGCTCGCCAC CACCGCGCGC 
CTGACCCGAA CCAGCATCAT GGAGAACATC CGGGCCGACT ACGTCCGGAC CGCTCGGGCC 
AAGGGGCTGG CGAACAAGCG GGTCATTGGC GTGCACACGC TGCGTAACTC GTTGATCCCG 
GTGATCACGT ACCTCGGTGT CGACATCGGC TCCGCCATGG CCGGCGCGGT GGTCACCGAG 
ACCATCTTCA ACGTGCCTGG TATCGGACGG ATGGTGACGC ACGCCGCCCG TAGCGGTGAG 
GCGGCCGTGG TCATCGGTGT GGTCACCATG CTGGTGCTGG TCGTTCTGGT CGCCAACCTG 
CTGGTCGACC TCCTCTACGC CGTGCTCGAC CCAAGGATTC GCTATGAGTG A

Protein sequence

MGRYVIRRLL QFIPTVLGTM FLLHYMTSLA IQFSGNPVLA LFGDRTPPQS VLDAITERLG 
YSDPCLDQRG NPCLGLFADR VSNIFLHFDF GINLNREEVT DMVANALPFT LKLLVIAIVF 
EAVVGIAAGV WAGLRGGSFA DNLVKISTVF VISVPIFVLG VVVREFVGVK FGNILRDQEW 
IPDVIATGVF SPGFKPDYPL ASLLIPGMVL GAVALATTAR LTRTSIMENI RADYVRTARA 
KGLANKRVIG VHTLRNSLIP VITYLGVDIG SAMAGAVVTE TIFNVPGIGR MVTHAARSGE 
AAVVIGVVTM LVLVVLVANL LVDLLYAVLD PRIRYE