Gene Avin_21230 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_21230
Symbol	csbX
ID	7761048
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	2120116
End bp	2121339
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	67%
IMG OID	643805018
Product	catecholate siderophore efflux pump, MFS_1 family
Protein accession	YP_002799299
Protein GI	226944226
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.000768503
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCCGG ACCAATCCCT GCAATCGGAA GCACGAACGA AACCTTTTGC AGCAATTTCA 
CCCAAGGTGC TCATCGCCCT GATCGCCTCC CTGCAGTTCA CCTACATTCT CGATTTCATG 
CTGGTCCTGC CGCTCGGCCC GGATTTGGCC AAAGGTCTCA ACTTTCACGG TAATCAAGTT 
GCATGGCTAA CAGCCAGCTA TACATTTGCG TCCTTGCTGT CCGGTCTGTT CACCGTGCCG 
CGCCTGGATC GCTTCGATCG CCGCAAGGCC CTGCTCTGGA GCCTGGTGGG ACTGGCGCTC 
GCTTCGCTGG CCTGTACCCT GGCGCATGAT TTGCCGAGCC TGCTGCTCGG ACGGGCCGTC 
GCCGGGCTCT GTGCCGCCCC GGCGATCGCC ACCGGCATGG CGATCCTGAT CGACCAGACG 
CCGCCGCCAC AGCGCGGGAC AGCCATCGCC AAGGTCATGA CCGGGTTTTC CATCGCCACC 
ATCGCCGGGA TTCCCCTGGC GCTGGAACTG GCGGACCACT TCGGCTGGCA GGCGCCCTTC 
GTGCTGGTGG CTGTGCTGGT GGTGCTGGTC GCCTTCGCCG TGGCCCATCT GTTGCCGCCG 
CTGACCGCCC ACCTGCAAGG GCCGGCTGGC AAGCCGTCGC TGGCCATGCT GAGCCGTCCC 
GGCGTGCGCC TGGCCACGCT GTTGCAGGGG CTCAACCAGT TCTCCGCCTT CCTGGTGATC 
CCGAGCTTCT CCGCGTTCTA CCTGCTGAAC CTCGATTACC CGCGTCAGCA ACTGGGTACG 
CTGTACCTGG TGGGCGGTCT GGTGGCGCTG GGGGCCATGC AACTGGCCGG ACGCCTGGGC 
GATCGACACG GCCACTGGCT GCCGGTCGGC GTGGCCAGCG CCTGTTTCGC CGTCGGCCTG 
CTGCCGTTCT TCGGCCTGAG CGCCTTGCCG CTGATGCTGA GCTTCGTGCT GTTCATGGCC 
GGCAACGCCG CCCGCACGGT CTGCCTGGCG GCCGCCATCA GCCATGTTCC GGCGCCGCCG 
GAGCGCGCCG GTTTCATGGC CCTGCAGAAG ATGACCCAGG ATTTCAGCGT GGCCCTGGCC 
GCCGGCGCCG CGGCGCTGGT GCTGGGTGGC GGCGACGGGC CGCTGACCCA TACCGGACTG 
CTCGCCACCC TGGCGATCGT CGGTGCGGGG CTGGTCCTCT GGGTGCTCGA ACGGCTGCGG 
CGAAACCTGC AGCCGCCGGC CTGA

Protein sequence

MNPDQSLQSE ARTKPFAAIS PKVLIALIAS LQFTYILDFM LVLPLGPDLA KGLNFHGNQV 
AWLTASYTFA SLLSGLFTVP RLDRFDRRKA LLWSLVGLAL ASLACTLAHD LPSLLLGRAV 
AGLCAAPAIA TGMAILIDQT PPPQRGTAIA KVMTGFSIAT IAGIPLALEL ADHFGWQAPF 
VLVAVLVVLV AFAVAHLLPP LTAHLQGPAG KPSLAMLSRP GVRLATLLQG LNQFSAFLVI 
PSFSAFYLLN LDYPRQQLGT LYLVGGLVAL GAMQLAGRLG DRHGHWLPVG VASACFAVGL 
LPFFGLSALP LMLSFVLFMA GNAARTVCLA AAISHVPAPP ERAGFMALQK MTQDFSVALA 
AGAAALVLGG GDGPLTHTGL LATLAIVGAG LVLWVLERLR RNLQPPA