Gene Avi_3005 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avi_3005
Symbol
ID	7386164
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Agrobacterium vitis S4
Kingdom	Bacteria
Replicon accession	NC_011989
Strand	-
Start bp	2511068
End bp	2512363
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	62%
IMG OID	643651992
Product	prophage MuSo2 F protein
Protein accession	YP_002550176
Protein GI	222149219
COG category	[S] Function unknown
COG ID	[COG2369] Uncharacterized protein, homolog of phage Mu protein gp30
TIGRFAM ID	[TIGR01641] phage putative head morphogenesis protein, SPP1 gp7 family

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.680604
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGGCGA CGATCGCAGC GCTGAAGCCG GACGATGCCA TCAAGGCTCT GAAGGCGCGC 
GGCGAACAGC TCGCGCCGTC CTTTTCCTGG CAGGACGTTT ATGCCGAGGA GCATGCCAAA 
CAGTTCACGG TCGCCAAGTC GGCCGGTTTC GATATCCTCA CAGACCTTTT CGACGGGCTT 
CAAACCAGCC TTGAAGAGGG CAAGACGTTT CGGGATTTCG CCAGCCAGGT GACGCCGGTT 
CTCCAGGCTA AGGGCTGGTG GGGCGTCCAG GACGTGACCG ATCCAGTGAC AGGGGAGCTT 
CGCAAAGCGC AGCTCGGCTC GACCCGTCGC CTGCAATTGA TCTTCGACGT GAACCTTCGC 
GTCTCTTATG CGGCGGGTCA TTGGGCGGCC TTTGAGCGCA ACAAGGCGCG CCGGCCTTGG 
CTGCGCTATG TCTGTATTCT GGACGACCAC ACCCGGCCGG AACACCGCAA GCGCCACAAT 
CTTTGCCTGC CCGTCGATCA TCCCTATTGG GACACATGGG CACCGCCTTG TGGCTGGAAT 
TGCCGCTGCA CGCTGCAAAG CCTGTCGGAT CGGGATGTCG AGCGGATGCG GGGTGAGTTG 
AAGTTCACGC CGCCCGAAGA TGACTTCGTT GCCTTCACCA ACAAGCGCAC TGGCGAAGTC 
CGGATGATCC CGCGCGGCAT CGATCCCGGT TGGGACCACA ATCCCGGCAA GGCTGGCTTT 
CGGGCCTTCG ATGCGGCGGA AAAGCTGATC AATGCACCGC CGATCATGGC CGCCCAGGTC 
AACAAAGATC CGGACTGGCT GGTCAAGCCG CTCGGCGATG ACTTTGCGAG GTGGTTTGAT 
GCGGCCACAG CGGGCGGGCG CGTGGACCGG TCCATCATCG TGGTTGGCGC TTTGTCCGAG 
GATGTCCTGG CATCTCTTGC CCAGGGCGGG ATTGCGCCGC AGTCAGGCGC GATCACCCTG 
ACCCAGCAAG CTGCTCTGCA TATGATCCGC GATGCCAAGG CCGGAGTGGG AAAGACCGTC 
GATATGGCGG CGCTTCGGCA ACTGCCGGCC AATCTCAGCC GGCCGAGGGC GGTCCTGCGG 
GATAAGCGCG ACGGTGCGCT TCTCTATGTG TTCGACAGCG GCCAAGACCC GCGTCTGGCC 
AAGATCGTTG TGAAGGTCGA TTTCGCAGAT AAGGCCCGGC CACCAGGGGG AAAAGCCCAG 
ACGATCGTCA CCAATTCGAT CCGAACTGCG GGGCTGGTTG AAGCCCGCGT CCTGACAGAC 
GAGAAGACTT ACGAGCTTAT CAGTGGGACG ATTTAG

Protein sequence

MTATIAALKP DDAIKALKAR GEQLAPSFSW QDVYAEEHAK QFTVAKSAGF DILTDLFDGL 
QTSLEEGKTF RDFASQVTPV LQAKGWWGVQ DVTDPVTGEL RKAQLGSTRR LQLIFDVNLR 
VSYAAGHWAA FERNKARRPW LRYVCILDDH TRPEHRKRHN LCLPVDHPYW DTWAPPCGWN 
CRCTLQSLSD RDVERMRGEL KFTPPEDDFV AFTNKRTGEV RMIPRGIDPG WDHNPGKAGF 
RAFDAAEKLI NAPPIMAAQV NKDPDWLVKP LGDDFARWFD AATAGGRVDR SIIVVGALSE 
DVLASLAQGG IAPQSGAITL TQQAALHMIR DAKAGVGKTV DMAALRQLPA NLSRPRAVLR 
DKRDGALLYV FDSGQDPRLA KIVVKVDFAD KARPPGGKAQ TIVTNSIRTA GLVEARVLTD 
EKTYELISGT I