Gene Avi_2102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avi_2102
Symbol
ID	7386903
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Agrobacterium vitis S4
Kingdom	Bacteria
Replicon accession	NC_011989
Strand	+
Start bp	1727106
End bp	1728326
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	60%
IMG OID	643651312
Product	aminohydrolase protein
Protein accession	YP_002549507
Protein GI	222148550
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.927814
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGATTG ATTTCGTGTT GCGCCGCGCC AGGTTGCCAT TGTCGGCGCA ACCGCTGGAC 
ATCGCCTTTG AGGCGGGGCG GATCGTTGCG CTGGAAGCGG ATTTCCGTTG TGATGCGCCG 
CAGGAGGATG CGGCAGGCCG GTTGGTCTGC GCCGGGTTGA TCGAAACCCA TCTGCATCTC 
GACAAGGCAG GGATCATCGG GCGCTGCCGG GTGTGTAGCG GAACGCTGGC GGAAGCCGTG 
TCGGAGACCT CGAAAGCCAA GCAGGCCTTT ACCGAGGAAG ATGTCTATGC CCGCGCCGCC 
GATGTCGTGG AACGGGCCAT CGTCCAAGGC ACGACCCGGA TCAGGACCTT CGTGGAAGTC 
GATCCACGCG CCGGTTTCCG ATCGTTTTCG GCGATCCGCA AGCTGAAGGC CGATTACGCC 
CACCTGGTCG ATATCGAAAT CTGCGCCTTT GCCCAGGAAG GGTTGACCAA TGAGCCGGAA 
ACCGAGCGGA TGCTGGAAAT CGCCCTGTCG CAAGGGGCCG ATCTGGTTGG CGGCTGCCCT 
TACACCGATC CAAGGCCCGC CGAGCATATT TCCCGAATTT TCGAGCTCGC GCAGCGCTTC 
GATGTGCCTG TCGATTTTCA CCTTGATTTC GATCTCGATC CTTCCGGGTC CAACCTGCCG 
ACGGTCATTG CCCAGACGCT GGCGCGTGGC TATCAAGGCA AGGTCTCTGT CGGCCATGTC 
ACCAAGCTTT CCGCAATTTC TCCCGACGAA GTGGAGCGGG TGGCAAAGCA ATTGGCCGAG 
GCGGGTATTA CCGTGACGGT TCTGCCTGCC ACCGACCTGT TTCTGACCGG TCGGGATATC 
GATCATCTTT GCCCAAGGGG AGTTGCTCCG GCGCATCTTC TGGCCCGCCA GGGGGTGAAT 
GTCACCATCT CCACCAATAA TGTTCTCAAC CCATTTACGC CCTTTGGCGA TGTCTCGCTG 
ATGCGCATGG CCAATCTCTA CGCCAATGTT GCCCAACTGG CGACGCCTGC GGATCTGAAC 
CAGGTCTTCG AGATGATTAC CCGCTATCCG GCCCGGCTGA TGGGGCTGGA TGAACAGCTG 
AAGGTTGGGG CTGCGGCTGA TCTTGTCCTT TTTGATGCCG TCTCCGGTGC CGAGGCCGTG 
GCGACGATTG CACCGGCGGT GACTGGTTGG AAAAACGGTG TGAAGACGTT CGAACGCAAG 
CCGCCGCAGC TCTATCGGTA A

Protein sequence

MAIDFVLRRA RLPLSAQPLD IAFEAGRIVA LEADFRCDAP QEDAAGRLVC AGLIETHLHL 
DKAGIIGRCR VCSGTLAEAV SETSKAKQAF TEEDVYARAA DVVERAIVQG TTRIRTFVEV 
DPRAGFRSFS AIRKLKADYA HLVDIEICAF AQEGLTNEPE TERMLEIALS QGADLVGGCP 
YTDPRPAEHI SRIFELAQRF DVPVDFHLDF DLDPSGSNLP TVIAQTLARG YQGKVSVGHV 
TKLSAISPDE VERVAKQLAE AGITVTVLPA TDLFLTGRDI DHLCPRGVAP AHLLARQGVN 
VTISTNNVLN PFTPFGDVSL MRMANLYANV AQLATPADLN QVFEMITRYP ARLMGLDEQL 
KVGAAADLVL FDAVSGAEAV ATIAPAVTGW KNGVKTFERK PPQLYR