Gene Avi_0100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avi_0100
Symbol
ID	7388282
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Agrobacterium vitis S4
Kingdom	Bacteria
Replicon accession	NC_011989
Strand	+
Start bp	96896
End bp	98620
Gene Length	1725 bp
Protein Length	574 aa
Translation table	11
GC content	57%
IMG OID	643649838
Product	hypothetical protein
Protein accession	YP_002548056
Protein GI	222147099
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0356789
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGCGAA AGCACTTAAT GACGACAACG GCGGCGATGC TGCTGGCCAT GACTGGTGCT 
GCCTATGCCG GTATGGATGA GGCCAAGCAA TTTCTCGATG AGGAGATCAA GGGGGAATCC 
TCGCTGTCGC GGGCGGATCA GGAAAAGCAG ATGCAATGGT ATGTGGATGC TGCCAAGCCC 
TTTTCGGGCA TGGAAATCCA TGTCGTTTCC GAATCGCTGA CCACCCATGC CTACGAATCC 
AAGGTGCTGG CGCCGTGGTT CAGCAAGATC ACCGGCATCA AGCTTACTCA CGACGTCATT 
CAGGAGGGTG ATGTCGTCGA GAAGATCCAG ACCCAGATGC AGACCGGCCA GAACCTCTAT 
GACGGCTGGG TCAACGATTC CGACTTCATC GGCACCCATT GGCGCTATGG TCAGGTCCGC 
AACCTGACGG ACTGGATGAC GGGCGAGGGC AAGGATGTCA CCGATCCGAT GCTGGATTTG 
AAGGATTATA TCGGCCTGTC CTTCACGACA GCCCCGGATG GCAAGCTCTA CCAGCTTCCC 
GACCAGCAAT TCGCCAACCT CTACTGGTTC CGCTACGATT GGTTCAACGA CCCGAAGATC 
AAGGAAGAGT TCAAGAAGGA ATACGGTTAC GAGCTGGGTG TGCCGGTCAA CTGGTCGGCC 
TATGAGGATA TTGCCAAATT CTTCACCGGA CGCGAGATTG GCGGCAAGAA AGTCTATGGC 
AGCATGGACT ATGGCAAGAA GGACCCCTCG CTCGGTTGGC GCTTTACCGA TGCCTGGCTG 
TCGATGGCCG GTAATGGCGA CAAAGGTCTG CCGAATGGTA AGCCCGTCGA CGAATGGGGC 
ATCCGTGTCA ACGACAAGGA CCAGCCGACC GGTTCCTGCG TCGATCGCGG TGGGGATACC 
AATGGGGCGG CCTCGGTCTA TGCCGTCACC AAATATCTGG AATGGTTGAA GAAATATACC 
CCGCCAGAAG CGCAGGGCAT GACCTTCTCC GAATCCGGCC CGGTTCCCGC CCAGGGCAAT 
ATCGCCCAGC AGATCTTCTG GTACACGGCC TTTACCGCCG ATATGGCCAA GCCCGGTTTG 
CCTGTGGTCA ATGACGACGG CACGCCGAAA TGGCGTGTGG CACCATCGCC GCATGGTTCC 
TACTGGCATG AAGGCCAGAA GCTCGGCTAT CAGGATGTCG GCTCCTGGAC GCTGATGAAA 
TCCACGCCCA CGGATCGCGC CAAGGCTGCC TGGCTCTATG CCCAGTTCGT CACCTCGAAA 
ACTGTTGACG TGAAGAAAAG CCAGACCGGT CTGACTTTCA TCCGTCAGTC GTCCATCATG 
GACAAGACCT TCACCGACCG CGCCCCGAAA CTCGGTGGTC TGGTGGAATT CTACAGGTCG 
CCTGCCCGCG TCCAATGGAC GCCAACCGGA ACCAATGTGC CTGATTATCC GAAGCTGGCG 
CAATTGTGGT GGCAGAATAT TGGCGATGCG GCAGCCGGTG CCAAGACCCC GCAGGAAGCC 
ATGGATGCCT TGTGCAAGGC GCAGGACGGC ATTCTCTCCC GTCTGGAACG CGCCAAGGTG 
CAGGGCGAAT TCGGCCCCAA GCTGAACGAG CCGAAGGACG CCGCCTATTG GGAAAAATAC 
GCCAAGGACC ACGGCAGCCT TGCGCCGCAG CCCAAGCTGG CTAACGAAAA GGAAAAGCCG 
ATCACCATCA ATTACGACGA ATTGGTGAAG AGCTGGCAGA AGTAA

Protein sequence

MMRKHLMTTT AAMLLAMTGA AYAGMDEAKQ FLDEEIKGES SLSRADQEKQ MQWYVDAAKP 
FSGMEIHVVS ESLTTHAYES KVLAPWFSKI TGIKLTHDVI QEGDVVEKIQ TQMQTGQNLY 
DGWVNDSDFI GTHWRYGQVR NLTDWMTGEG KDVTDPMLDL KDYIGLSFTT APDGKLYQLP 
DQQFANLYWF RYDWFNDPKI KEEFKKEYGY ELGVPVNWSA YEDIAKFFTG REIGGKKVYG 
SMDYGKKDPS LGWRFTDAWL SMAGNGDKGL PNGKPVDEWG IRVNDKDQPT GSCVDRGGDT 
NGAASVYAVT KYLEWLKKYT PPEAQGMTFS ESGPVPAQGN IAQQIFWYTA FTADMAKPGL 
PVVNDDGTPK WRVAPSPHGS YWHEGQKLGY QDVGSWTLMK STPTDRAKAA WLYAQFVTSK 
TVDVKKSQTG LTFIRQSSIM DKTFTDRAPK LGGLVEFYRS PARVQWTPTG TNVPDYPKLA 
QLWWQNIGDA AAGAKTPQEA MDALCKAQDG ILSRLERAKV QGEFGPKLNE PKDAAYWEKY 
AKDHGSLAPQ PKLANEKEKP ITINYDELVK SWQK