Gene Avi_5420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avi_5420
Symbol
ID	7381519
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Agrobacterium vitis S4
Kingdom	Bacteria
Replicon accession	NC_011988
Strand	-
Start bp	421282
End bp	422394
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	60%
IMG OID	643649027
Product	lipoprotein
Protein accession	YP_002547264
Protein GI	222106473
COG category	[R] General function prediction only
COG ID	[COG1744] Uncharacterized ABC-type transport system, periplasmic component/surface lipoprotein
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.406883
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCGACC TGCGCAGCCT TTCCCGTCGC GGTTTTCTCA ACATGGCGGC AGCCGGCAGC 
GCCTCACTGG CGCTTCCCGG CATGGTGCGC TCTGCCTCAG CCGCCAATAC CCTGGCGGCC 
ATAAAGGAAG AGGACGCCGT GATTGGCTTC GGCCATGTCG GCCCGGTGAC GGATGAAGGC 
TGGACCTGGT CGCACCATCA GGGTGTTCTC GCCGTCAAGG AAAAATTCCC CAAGCTGAAG 
AAGATCCTCG AGGTCGAGAA CGTTCCCTAT TCAGCGGATG CGACCCGCAC CTATCGGCAA 
TTCGTGTCGG AAGGCGCGAA CATGATTTTC GATACGTCGT CTACCGGCGA CTTCCTGCAT 
GACGTGGTGC GCCGCGCCAA AGACACCGCC TTCATGGAGT GCAATGGCCA TGTGACGATG 
GACAATCTCG GCTGGTATTA TATGGCCCAT TGGTATCCAA CCTATGTGGT CGGCGTCGCC 
GCAGGGCATC TGTCGAAAAC CGGCAAACTC GGTTACGTCG CCTCCTTCCC GGTTGCTTCG 
GTCTATGCCT CGACCAACGC CTTCCTGATG GGCGCGCGCA CCGTCAACCC CAATGCCACC 
TGCCAGACCA TCACCATCAA TTCCTGGTTC GATCCGCAGG CCGCCGCCCA GGCTGGCACC 
GCGCTGATCG ACAATGGCTG CGATTTCCTG TTCGGCATCA TGGATGAGGC CGCCTATCTT 
CAGGTCGCCG AAAAACGCGG CGTCTGGGCT GCGATGTGGA ACACCGACAT CCGCCGCTAT 
GGCCCGAATT CCTACGTGTC TTCGATCATT ATCGACTTCA AGGAGTTCTA TATCGATCAG 
GTCCGCAAGC GGCTGGCAGG CGAATGGTCG CCTTCGGAAA GCATCTTCGC CATGGGCGCA 
GGCGTTGACC GCGATAGCTG GGGCGCCAAG GTTCCCGCCG AAGTCGGCAA GGCGGCAGAC 
GATATACGCA CGAAAATCCT GGGCGGCTGG TCGCCGTTTG TCGGCGAATT GAAGGACGCC 
AAGGGCGCTG TGCGGGTGGC CAAGGGCCAG AAGATGACCG AACTCGAGCT TTATAATTGG 
GATTGGTCAG TGGAAGGCGT CACGGGGCTT TAA

Protein sequence

MIDLRSLSRR GFLNMAAAGS ASLALPGMVR SASAANTLAA IKEEDAVIGF GHVGPVTDEG 
WTWSHHQGVL AVKEKFPKLK KILEVENVPY SADATRTYRQ FVSEGANMIF DTSSTGDFLH 
DVVRRAKDTA FMECNGHVTM DNLGWYYMAH WYPTYVVGVA AGHLSKTGKL GYVASFPVAS 
VYASTNAFLM GARTVNPNAT CQTITINSWF DPQAAAQAGT ALIDNGCDFL FGIMDEAAYL 
QVAEKRGVWA AMWNTDIRRY GPNSYVSSII IDFKEFYIDQ VRKRLAGEWS PSESIFAMGA 
GVDRDSWGAK VPAEVGKAAD DIRTKILGGW SPFVGELKDA KGAVRVAKGQ KMTELELYNW 
DWSVEGVTGL