Gene Avi_7341 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avi_7341
Symbol
ID	7380553
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Agrobacterium vitis S4
Kingdom	Bacteria
Replicon accession	NC_011981
Strand	-
Start bp	321179
End bp	322459
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	56%
IMG OID	643641416
Product	sugar ABC transporter sugar-binding protein
Protein accession	YP_002539713
Protein GI	222102674
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTACAGGC AGAAATTTGG GATATCGCTG ACCATTGCCG CTGCGGCACT GGGAATGGTC 
ACTGTCATGG CAGGCGGCGC GTTCGCACAA TCGGCAGCCC CCGTCACCTT GAAATGGGCG 
CTGTGGGACT GGGACAAGGT GGCCTATTAC AAGCCGCTGA TAGAAGCCTA TCAGGCCAAG 
CATCCGAATG TGAAATTCGA GCCGGTGGAT CTCGGTTCGC AGGACTACAC GCAGATGATC 
GCCACCCAAC TGACCGGTGG CGCCAAGGAT ATCGACGTCG TCACCATCAA GGACGTGCCG 
GGCTACGCGA CCCTGGTGCG GGCCAACTCT ATCGGCGATC TCTCCGGTTT CATGACCGAG 
CAGAAGATCG ACAAAGCTAG ATATGGCGGG CTTATCGAGG AGCTGAGCAT TGACGGCAAG 
GTCTATGCAA TACCCTTCCG CTCTGACTTC TGGGTGGTCT ATTATAACAA GGACATCTTC 
GACAAAGCGG GCGTTTCCTA CCCGACCAAT GACATGACCT GGACACAGTT CGACCAGATC 
GCAGTTAAGC TGAAGGGCGG CATGGGGGTC AACAAGACCT ACGGCGCATT GCTGCACACA 
TGGCGTTCGA CCGTTCAGCT TCCGGGCATC ATGGATGGTC AGCATACGCT GGTCGGTGGC 
GATTACGCTT TTCTGAAGCC CTGGTATGAG CGGGCGCTGA AGCTTCAAAA GGAAGGTGCG 
ATCCCGTCCT ATGCATCGCT GAAAACCTCC AATACCCATT ATTCGGCGCT GTTCTTCAAC 
GGGACGGTCG GTATGCTGCC GATGGGGACC TGGTTCATCG GCACCCAGAT CGCCAAGGTA 
AAGTCCGGTG AATCCAAGAG CAAGAATTGG GGCATCGTCA AATTCCCGCA CCCAGACGGC 
GTTGCAGCCG GCACAACGGC GGCGCAGATT GCGGCTCTTT CGGTCAATAA CAACTCAGCC 
CACAAAGACG TGGCGCTTGA CTTCATCAAG TTCGTGACTG GACCTGAAGG TGCGGCAATC 
ATTGCCGATA CGGGAACTTT GCCAGCGGTG CGCACAGACG ATGTCAGCAC CAAGATCACC 
TCGCTGCCCG GCTTCCCGCA GGACGAAAAC AGCAAGGCGG CGCTTAAAGC CGGCAAGTCC 
TATCTGGAAA TGGCGGTCAG TCCCAATGCA GCAAAAATCG AGGTCGTGCT GAACCGTGTG 
CATGACGCGA TCATGACAGA CAACACATCT ATCGACGATG GCCTGAAGGA GATGAACGAC 
GGCGTCAAGG CGATCAAATA G

Protein sequence

MYRQKFGISL TIAAAALGMV TVMAGGAFAQ SAAPVTLKWA LWDWDKVAYY KPLIEAYQAK 
HPNVKFEPVD LGSQDYTQMI ATQLTGGAKD IDVVTIKDVP GYATLVRANS IGDLSGFMTE 
QKIDKARYGG LIEELSIDGK VYAIPFRSDF WVVYYNKDIF DKAGVSYPTN DMTWTQFDQI 
AVKLKGGMGV NKTYGALLHT WRSTVQLPGI MDGQHTLVGG DYAFLKPWYE RALKLQKEGA 
IPSYASLKTS NTHYSALFFN GTVGMLPMGT WFIGTQIAKV KSGESKSKNW GIVKFPHPDG 
VAAGTTAAQI AALSVNNNSA HKDVALDFIK FVTGPEGAAI IADTGTLPAV RTDDVSTKIT 
SLPGFPQDEN SKAALKAGKS YLEMAVSPNA AKIEVVLNRV HDAIMTDNTS IDDGLKEMND 
GVKAIK