Gene Avi_1968 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avi_1968
Symbol
ID	7387254
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Agrobacterium vitis S4
Kingdom	Bacteria
Replicon accession	NC_011989
Strand	+
Start bp	1623281
End bp	1624588
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	61%
IMG OID	643651217
Product	hypothetical protein
Protein accession	YP_002549413
Protein GI	222148456
COG category	[S] Function unknown
COG ID	[COG4695] Phage-related protein
TIGRFAM ID	[TIGR01537] phage portal protein, HK97 family

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCATCCA AGAAAGGCAA GGCCGAGCGG CGTTCAACGT CGCTCGAAAG CGAAACCGTG 
CCGGTCAGCG CCACCAATTT TATGGAGTTC TTCGGGCTTG GCGGCGGCGC ACTGCCCACG 
GTCAATATCG AAACGGCCCT GAAAGTCCCG GCTGTGCAGG CGGCGGTATC GTTTCTGTCG 
CGGACCCTCG CAACACTTCC GCTGCATGTC TACCGGACGG GCGAACGCGG ACCGGTGCGG 
CTCGGCGGAA AGCTGGCTGT CGTTCTGGAG GAAAACCCGA ATGACGAAAT GGACACCTCA 
AAGTTCCGGC GCTTCTTCTG GGAACAGGTG TTTACCGGCG GGCGGGGGCT GGCCTGGATC 
GAGCGCAAGG GTGCTGGCAT CGAGGCGCTT TGGCCGATTG ATCCCGGCAG CTGTTCGATC 
AGGCGGCGTG GCGGGCGGCT GTTCTACAGT TTCGAGGGCA GGGAATATCC AGCCACCGAC 
GTGATCGACA TCCCCTATAT GCTGAAGCGT AATCTGGTCC AGCATCGCGG CCCGATTGCC 
ATGGCGGAAA AGGCCATCCA ACTGGCGCTG GCCATGAACG ACTATGCCTC GAACTTCTTT 
GCAGGCGGCG GCGTTCCGCC CTTGGCGCTG GAAGGGCCGA TGCCTGCCAA TGACAAGGCC 
ATGCAGCGGG CGCGTGAAGA TATCAAGCGG GCGGTGAAGG CGGCGCGAGA CGATCAGCTT 
CCGCTGATCC AGTTGCCGGT CGGCTACAAA CTCACCCAAG TGGGTTACGA CCCGGCCAAG 
GGGCAGATGA CCGAGGCGCG GCTTTACCAG GTGCAAGAGA TTGCCCGCGC CTATCAGATC 
CCGCCGAACT TCCTTCAGGA CTTGAGCCGA GCAACCTTCT CCAATGTCGA GCAGAACGAC 
CTCTATCTGG TCAAGCATCT GGTCAGCCAA TGGGCGACGG CGATGGAAGG GGAAATGAAC 
CTGAAGATTT TTGGGCGGAT GAATACCCGC CGTTATGTCC GCCACAACCT CGACGGCCTG 
ATGCGCGGTG ACTTCAAGAG CCGGTTGGAA GCCTTAGCAA CCGGCGTCAA TTCGGCGCTG 
CTGACCCCGA ACGAGGGCCG AGAGATTGAA GGCCGTCCAC GTGATCCGAA CCCGGCTGCC 
GACCAACTCT ACATCCAGGG CGCAACCGTC GCCATCGGCA CCAGTGTCAT CGACACAAGT 
GCCCCCGGCA CAAATGCGAT GGGCGAGAAT AGCGACCCGC CGCTCAATGA TCCCGCAGCA 
GACACAGAAA GGCAGGTGAC CGATGACACC GAAACCGAAA CCGGGTGA

Protein sequence

MASKKGKAER RSTSLESETV PVSATNFMEF FGLGGGALPT VNIETALKVP AVQAAVSFLS 
RTLATLPLHV YRTGERGPVR LGGKLAVVLE ENPNDEMDTS KFRRFFWEQV FTGGRGLAWI 
ERKGAGIEAL WPIDPGSCSI RRRGGRLFYS FEGREYPATD VIDIPYMLKR NLVQHRGPIA 
MAEKAIQLAL AMNDYASNFF AGGGVPPLAL EGPMPANDKA MQRAREDIKR AVKAARDDQL 
PLIQLPVGYK LTQVGYDPAK GQMTEARLYQ VQEIARAYQI PPNFLQDLSR ATFSNVEQND 
LYLVKHLVSQ WATAMEGEMN LKIFGRMNTR RYVRHNLDGL MRGDFKSRLE ALATGVNSAL 
LTPNEGREIE GRPRDPNPAA DQLYIQGATV AIGTSVIDTS APGTNAMGEN SDPPLNDPAA 
DTERQVTDDT ETETG