Gene Spro_2246 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_2246
Symbol	araG
ID	5605100
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	+
Start bp	2447698
End bp	2449233
Gene Length	1536 bp
Protein Length	511 aa
Translation table	11
GC content	58%
IMG OID	640937785
Product	L-arabinose transporter ATP-binding protein
Protein accession	YP_001478475
Protein GI	157370486
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1129] ABC-type sugar transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.000000548441
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACCGCCG CATTGCCGTA TTTGGCGTTT AAAGGCATAG GTAAAACCTT CCCGGGCGTG 
AAGGCGTTGG ATGACATCAG CTTTAGCTGT CAGGCCGGGC AGATCCACGC GCTGATGGGG 
GAAAACGGCG CTGGGAAATC CACGCTGCTG AAAATTCTCA GTGGCAATTA CGCGCCAACC 
CAGGGGGAAA TTCAGCTGCA GGGACGGTCG GTGCAGTTTG CCAACACCAC CGATGCGTTG 
AATGCCGGGG TGGCGATTAT CTATCAGGAA CTGCATCTGG TGCCGGAAAT GACGGTGGCT 
GAGAACATTT ATCTTGGCCA ACTGCCGACC AAACGCGGGC TGGTGGACAG AAAACTGCTG 
CGCTATGAAT CCCGCTTGCA GCTCCAACAC CTCGGCCTGG ATATTGATCC GGATACGCCG 
CTGAAATACC TGTCGATCGG CCAGTGGCAA ATGGTGGAAA TCGCCAAGGC GCTGGCGCGC 
AACGCCAAGG TGATCGCCTT TGACGAACCC ACCAGTTCAC TTTCCGCCAG AGAGATTGAG 
CAACTGTTCC GGGTGATCCG GGAATTACGT GCCGAAGGGC GGGTGATCCT GTATGTCTCG 
CACCGTATGG AAGAAATTTT TGCCCTCAGC GACGCCATTA CCGTGTTTAA AGATGGCCGC 
TACGTGCGCA CCTTTGACGA TATGCGGCAG GTGGATAACG CGCAGTTGGT GCAGGCGATG 
GTCGGGCGCG ATCTGGGTGA CGTCTATGGC TACCAGCCAC GTGAGCTGGG GCCGGTGCGT 
CTGGAGCTCA AGGGGCTGAA AGCACCGGGC GTCAAAACGG CGATCGATCT TAGCGTGCGG 
GCCGGAGAGA TCGTCGGGCT GTTCGGCCTG GTGGGAGCCG GGCGCAGTGA ACTGATGAAG 
GGGGTTTTTG GTGCCACACG GGTCAGTGCC GGCCAATTGA TGCTGGATGG ACAGGCGATC 
GCCATTCGTT CACCGATTGA CGCGATCCGC GCCGGTATCA TGCTGTGCCC GGAGGATCGC 
AAGGCGGACG GCATCATCCC GGTGCACTCG GTGCGTGACA ACATCAACAT CAGCGCAAGG 
CGCAACAGCC TGCGCGCCGG TTGCCTGATC AACAAAGGGT GGGAGGCCAG CAATGCCGAT 
CATCATATTC GTGCATTGAA TATCAAAACG CCTGGCCCTG AGCAGTTGAT TATGAATTTG 
TCCGGCGGCA ATCAGCAGAA GGCCATTCTG GGTCGCTGGC TGTCGGAAGA GATGAAAGTG 
ATCTTGCTCG ATGAACCAAC ACGCGGCATC GACGTCGGTG CCAAGCATGA AATTTATCAC 
GTCATTTACC AACTGGCGCA GCGCGGCATT GCGGTGCTGT TCGCCTCCAG TGACCTGCCA 
GAGGTGCTGG GGCTGGCTGA CCGTATCCTG GTGATGCGTG AAGGCGCACT GTCCGGCGAA 
TTACGGCATG ACGAGGCCAG TGAGGAAAAA GCCCTCAGCC TGGCGATGCT GCGCACCCCC 
GATATAGCCC CAGATGCCGC TGCGGCGGTG GCCTGA

Protein sequence

MTAALPYLAF KGIGKTFPGV KALDDISFSC QAGQIHALMG ENGAGKSTLL KILSGNYAPT 
QGEIQLQGRS VQFANTTDAL NAGVAIIYQE LHLVPEMTVA ENIYLGQLPT KRGLVDRKLL 
RYESRLQLQH LGLDIDPDTP LKYLSIGQWQ MVEIAKALAR NAKVIAFDEP TSSLSAREIE 
QLFRVIRELR AEGRVILYVS HRMEEIFALS DAITVFKDGR YVRTFDDMRQ VDNAQLVQAM 
VGRDLGDVYG YQPRELGPVR LELKGLKAPG VKTAIDLSVR AGEIVGLFGL VGAGRSELMK 
GVFGATRVSA GQLMLDGQAI AIRSPIDAIR AGIMLCPEDR KADGIIPVHS VRDNINISAR 
RNSLRAGCLI NKGWEASNAD HHIRALNIKT PGPEQLIMNL SGGNQQKAIL GRWLSEEMKV 
ILLDEPTRGI DVGAKHEIYH VIYQLAQRGI AVLFASSDLP EVLGLADRIL VMREGALSGE 
LRHDEASEEK ALSLAMLRTP DIAPDAAAAV A