Gene Cag_1740 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1740
Symbol
ID	3746523
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	2259095
End bp	2260195
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	47%
IMG OID	637774277
Product	aminopeptidase P
Protein accession	YP_380034
Protein GI	78189696
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATTCTC TTACCCTCCA ATTACAGCAC TATCGCCAAA GTAGCTATCA GCACATTGTG 
CAAAAAATGG TGAACCTTGC ACTTGATGCC TTTATAGTTA CAGAACTACC CATTATCCGA 
TGGCTTACAG GTTTTAGCGG CTCCTCTGCT CGTTTACTGA TTACGCGCGA AAAGGTGTGG 
CTTTTTACCG ACTTCCGCTA TCAAGAGCAA GTACGCCACG AAGTTACCCT TGCCGAAACG 
GTTATTGTTG CCGAAGGTTT TATTGCAGAA CTTTTGTTGG GCAACTATCC ATGCGGCACA 
ACAATTGCCT TGCAAGCCGA ACACATTACA TGGCAGGAAG CTAATCGTTT ACGCGACAAA 
GTGTTTCATG CTCAGCAAGT AATGCCTATT GAAGGTTTTT TTAATGAATT CCGCATAATA 
AAGCAGGCAG TAGAACTTGA CTACATGCAA CGCGCTGCGG CTCTTAGCGA AGCGGCACTT 
GAAGCGGTGC TTCCCATGAT TTCCCCCAAT GTTACCGAGC TTGATATTGC CGCAGAACTA 
AGCTACCAGC AAAAAAAACG AGGTGCTTCA GGCGATTCAT TTTCCCCCAT TGTGGCAAGC 
GGAGCACGAG CAGCAATGCC CCACGCAACT CCCACCAACG CCCATTTTGT GCAAGGTGAA 
CTTATTTTGC TCGACTTTGG CTGTATGTAT GAAGGCTACG CCTCCGATCA AACCCGCACG 
GTGGCACTTG GTAAACCCTC AAAACAAGCA AGTACCATTT ATAACATTGT ACGAAAAGCG 
CAGCAACTTG GTTTAGAGCG CGCTCAATGC GGCATGAAAG CACGAAAGCT AGACGAGGTG 
GTGCGCCGTT TTATTACCAA ACATGGCTAT GGCGAACAAT TTGGGCACGC ACTTGGGCAC 
GGTATTGGGC TTGAAGTACA CGAAGAGCCT CGTATTAGCT CCCGCAGCGA AACCATTTTG 
CAAGAGATGA TGCTTTTTAC CATTGAACCG GGCATTTATC TCCCCAATTG CTGTGGGGTT 
CGCATTGAAG ATACGGTAGT TATGGGCACA CAAGGGGCTA TGCCGCTTCA GCAATTTAGC 
AAAGAACTTA TTGTGCTTTA A

Protein sequence

MDSLTLQLQH YRQSSYQHIV QKMVNLALDA FIVTELPIIR WLTGFSGSSA RLLITREKVW 
LFTDFRYQEQ VRHEVTLAET VIVAEGFIAE LLLGNYPCGT TIALQAEHIT WQEANRLRDK 
VFHAQQVMPI EGFFNEFRII KQAVELDYMQ RAAALSEAAL EAVLPMISPN VTELDIAAEL 
SYQQKKRGAS GDSFSPIVAS GARAAMPHAT PTNAHFVQGE LILLDFGCMY EGYASDQTRT 
VALGKPSKQA STIYNIVRKA QQLGLERAQC GMKARKLDEV VRRFITKHGY GEQFGHALGH 
GIGLEVHEEP RISSRSETIL QEMMLFTIEP GIYLPNCCGV RIEDTVVMGT QGAMPLQQFS 
KELIVL