Gene Avi_7168 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avi_7168
Symbol
ID	7380333
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Agrobacterium vitis S4
Kingdom	Bacteria
Replicon accession	NC_011981
Strand	-
Start bp	135594
End bp	136652
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	57%
IMG OID	643641281
Product	hypothetical protein
Protein accession	YP_002539578
Protein GI	222102539
COG category	[R] General function prediction only
COG ID	[COG3491] Isopenicillin N synthase and related dioxygenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.04303
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACTTC AACAAAAAAT CGCAACCCTG CCCTTTGTGG ATATTGGCCG CTTCCATGCG 
GGACCAGAGG AGCGCGCAGC CTTCATCGCA GACCTGCGTC GCATTCTGTT TGATCACGGC 
TTTTTCTATC TCACCGGCCA TGGCGTTGAT CCAAAGCTGA TTGCGGATGT GCTCGAGACC 
GCCAAACGCT TTTTTGCGCT GCCGCTTGAG GAAAAGCTGA AGATTGAAAT GGTGAAATCC 
CGGCACTTTC GCGGCTACAA TCGTGCGGGC TATGAGCACA CCCGTGGTCA GCAGGATTGG 
CGCGAACAAC TGGATATAAA TACGGAAGGC ACGCCTGTCG AGATTGGCCC GGAAACACCT 
GCGTGGAAAC GTTTGCTCGG GCCAAATCAA TGGCCAGAGG CTATTCCAGA ACTAAAGCCC 
CTGCTGCTGA CCTATCAGGC AGAAGTCACC TGCGTTGGCA TTGATGTTTT GAAGGCCATT 
GCCGTGGCGC TTGACCAGCC GGAAGATGTG TTTGCGCAGA TCTACGAGCC GCAACCATCG 
CAACTGTTGA AAATCATTCG CTATCCCGGG CGGGATGTGG CTGAGACAGA TCAGGGCGTT 
GGTGCCCACA AGAACGGCGG CTTCGTCACG GTTCTTTTGC AAGACAAGGT CGAAGGTCTA 
CGGGTGCAGA CTGAAGACGG CGTGTGGCTG GATGCTCCGC CCGTACCGGG CACCTTCGTG 
GTTAACACCG GGGAATTGCT GGAACTGGCC ACCAATGGCT TCGTGCGGGC CGACGTGCAT 
GATGTGGTTG CACCGCCTGC CGGTATCGAG CGCTTCTCCG TCGCCTTCTT CTTAGGCTCG 
CGCTACGACG CAACGATTCC GGTGATTACG CTTCCAGACG AGCTGCATCG AAAAGAGCGC 
GGCATCACGG TTGATCTGCT GAACCCGATC TTTCGGGAAG TTGGCCAGAA CCATCTCAAA 
AGCCGCCTGC GGTCGCACCC CGATGTTGCC CGCGCCCACC ACGCTGATTT GCTCACGCCT 
GAGCAATTGG CCGGACAGGC GGTAGCGCAG GCCTATTAA

Protein sequence

MTLQQKIATL PFVDIGRFHA GPEERAAFIA DLRRILFDHG FFYLTGHGVD PKLIADVLET 
AKRFFALPLE EKLKIEMVKS RHFRGYNRAG YEHTRGQQDW REQLDINTEG TPVEIGPETP 
AWKRLLGPNQ WPEAIPELKP LLLTYQAEVT CVGIDVLKAI AVALDQPEDV FAQIYEPQPS 
QLLKIIRYPG RDVAETDQGV GAHKNGGFVT VLLQDKVEGL RVQTEDGVWL DAPPVPGTFV 
VNTGELLELA TNGFVRADVH DVVAPPAGIE RFSVAFFLGS RYDATIPVIT LPDELHRKER 
GITVDLLNPI FREVGQNHLK SRLRSHPDVA RAHHADLLTP EQLAGQAVAQ AY