Gene Xaut_4036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Xaut_4036
Symbol
ID	5424401
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Xanthobacter autotrophicus Py2
Kingdom	Bacteria
Replicon accession	NC_009720
Strand	+
Start bp	4464890
End bp	4465885
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	67%
IMG OID	640883290
Product	ABC sulfate transport system, periplasmic binding protein
Protein accession	YP_001418915
Protein GI	154247957
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.7213
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0122121
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGGAT TGCTCAATCG GCGCACGCTG CTCAGCGCGC TCGCAGGCTC CGCCGGGGCC 
CTCGCCCTGC CGCATCTGCC GGCGCTGGCG GCCCCGGCGC AGGGGCTCGA AATCCTCGGT 
GCGCCCAATG GCTCCACCAT CGTGCTGCTG CGCCTGCTGC AGTCCGGCGC GCTCGACCAG 
GTGGCGCCCG GCGCGTCCTT CCGCCTGTGG CGCGACACGG ACGAGTTGCG CGCCGCCATC 
GTCTCCGGCC GCACCAGCCT GTTCACCACC CCCACCCATG TGCCGGCGAA CCTCGCCAAT 
CGCGGCTTGC CGCTGAAGCT GTTCGCGATC CTGTCCATGG GCCATCTGTT CGTGGTGTCG 
GGGGACGAAG GCATCAAGTC GTTCAAGGAC CTTGCCGGCA AGGAGCTGGT CGGCTTCTTC 
AAGAACGACA TGCCCGACCT CGTCTTCCGT TCCATCGCCA AGGGCTACGG CATGGATCCG 
GACAAGGACA TGAGCATCAC CTATGTGCGC ACCCCCATGG AGGCGGCGCA GATGCTGGCC 
GCCGGGCGCG CCACCACCGC CATCCTTTCC GAGCCGCCGG CTACCGCAGC CATCCTGATG 
GCGAAGAAGG AGGGCCGCAT CCTCAACCGC GCCATCAGCC TGCAGGACGA CTGGAAGGTG 
CAGCACAAGG GCCTCGGCCT GCCCATGGCC GGCATCGCCG TGCACGAGCG CCTGATCGAG 
CACAGCCCCG AGCTGATCGC GGCGCTCGGT GCGGGCCTGC CCGGAGCCCG CGACTGGGTG 
ATGGCCAACA AGAGTGAAGC AGGCCAGCTC GCCGAGCAGA AGATGGACGT GAAGGCCCAC 
ATGTTCGCCA ACGCCCTCGA CCACTTCAAC GTGGTGGCGG AACCGGCGGC GAAACAGAAG 
GCCGGCCTCA TCGCCTTCTA CGAGACCCTT TTGGCCTTCG AGCCGGATGC ATTGGCCGGC 
AAGCTGCCGC CCGACAGCTT CTACATGAAC TTCTGA

Protein sequence

MNGLLNRRTL LSALAGSAGA LALPHLPALA APAQGLEILG APNGSTIVLL RLLQSGALDQ 
VAPGASFRLW RDTDELRAAI VSGRTSLFTT PTHVPANLAN RGLPLKLFAI LSMGHLFVVS 
GDEGIKSFKD LAGKELVGFF KNDMPDLVFR SIAKGYGMDP DKDMSITYVR TPMEAAQMLA 
AGRATTAILS EPPATAAILM AKKEGRILNR AISLQDDWKV QHKGLGLPMA GIAVHERLIE 
HSPELIAALG AGLPGARDWV MANKSEAGQL AEQKMDVKAH MFANALDHFN VVAEPAAKQK 
AGLIAFYETL LAFEPDALAG KLPPDSFYMN F