Gene Gdia_0622 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_0622
Symbol
ID	6974019
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	697682
End bp	698929
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	69%
IMG OID	643390153
Product	peptidase M29 aminopeptidase II
Protein accession	YP_002275029
Protein GI	209542800
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2309] Leucyl aminopeptidase (aminopeptidase T)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.141981
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTTCCG CATCGTCCCA TGACGGCCTG CTGGACCGGC TGGCCGAGGT CGCGGTCCGA 
ACCGGACTGA ACCTGGCGCC GGGCCAGCAA TTGCTGATCA CCGCGTCGCT GGACGCGGTT 
CCGCTGGTGC GCCGCATCAC CGAACACGCC TATCGCGCCG GCGCGTCGCT GGTCACGCCG 
TTCTTCTCGG ACGACGAGAT GACGCTGGCG CGATTCCGCC ACGCCCCGGA TGCGTCCTTC 
GACGTCGCGG CCGGCTGGCT GCAGGACGGC ATGGCCAACG CCTATCGCCA GGGCGCCGCG 
CGGATGGCCG TGACCGGCGG CAACCCCACC CTGCTGGCCG GGGAAGACCC GGACCGCGTC 
GCCCGCGCCG GCAAGGCCAG TTCGCTGGCC GGCCGCCCGG CGATGGAACT GATCACCAAT 
TTCGCCGTCA ACTGGAACAT CGTCGCCTGC GCCACCCCGG CCTGGGCCGC GCAGGTGTTC 
CCCGACGATG CCCCGGACAG GGCGCTGGCC CGGCTGTGGG ACGCGATCTT CCTGGCGTCC 
CGCGTCACGG TGGACGACCC CGTGGCGGCG TGGGTCGAGC ATAACGACAC GCTGCACCGC 
CGCGCCGACT GGCTGAACGA GCGCCGGTTC GCGGCGCTGC AGTTCACCGG GCCGGGTACG 
GACCTGACGG TGGGGCTGGC GGACGGCCAT GCCTGGGCCG GCGGGTCGGA ACCGGCGCGC 
AACGGCATCG TGTGCAACCC CAATATCCCG ACCGAGGAAG TCTTCACCAC GCCGCACGCG 
CGGCGGGTCG AGGGCTATGT CCGCGCGACG AAGCCCCTGT TCCACCAGGG CACGCTGATC 
GACGGCATCG CGGTCCGCTT CGCCGACGGG CGCATCGTCG AAGCGCATGC GACCGAGGGG 
CTGGAGGTGC TGGAACGCAT CCTGGACACC GACGAGGGCG CCCGCCGGCT GGGCGAGGTG 
GCGCTGGTGC CGCATTCCTC GCCGATTTCG CAGAGCGGCG TGCTGTTTCG CAACACGCTC 
TTCGACGAAA ACGCGTCCAG CCATATCGCG CTGGGCCAGG CCTACACGAA ATGCATGCTG 
GATACCGAGA ACCAGACGCC CGAGCAGATC CAGGCCCGTG GCGCCAACAG CAGCTTCATC 
CATATCGACT GGATGATCGG CTCGGCCGAG ATCGACGTGA CCGCCATCAC CCAGGATGGC 
GCGTGCGAAC CCCTGATGAA ACATGGTGAG TGGGTCAACA AAGTATGA

Protein sequence

MTSASSHDGL LDRLAEVAVR TGLNLAPGQQ LLITASLDAV PLVRRITEHA YRAGASLVTP 
FFSDDEMTLA RFRHAPDASF DVAAGWLQDG MANAYRQGAA RMAVTGGNPT LLAGEDPDRV 
ARAGKASSLA GRPAMELITN FAVNWNIVAC ATPAWAAQVF PDDAPDRALA RLWDAIFLAS 
RVTVDDPVAA WVEHNDTLHR RADWLNERRF AALQFTGPGT DLTVGLADGH AWAGGSEPAR 
NGIVCNPNIP TEEVFTTPHA RRVEGYVRAT KPLFHQGTLI DGIAVRFADG RIVEAHATEG 
LEVLERILDT DEGARRLGEV ALVPHSSPIS QSGVLFRNTL FDENASSHIA LGQAYTKCML 
DTENQTPEQI QARGANSSFI HIDWMIGSAE IDVTAITQDG ACEPLMKHGE WVNKV