Gene CPR_2046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_2046
Symbol
ID	4206454
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	2264082
End bp	2265572
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	32%
IMG OID	642566596
Product	amino acid permease family protein
Protein accession	YP_699355
Protein GI	110801782
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0531] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTAATA GTAATGATGG AAAAAAACTT ATGTGGTATA ACCTTGGTTT AATGGCCTTT 
GTATCAGTTT GGGGCTTTGG TAACGTAGTA AATAACTTCG CAACTCAAGG TTTAACCGTA 
ATAACTTCAT GGATATTAAT AATAGCTTTA TACTTCGTAC CATATGCGCT TATGGTTGGA 
GAATTAGGCT CAACTTTTAG AGATAGTAAA GGTGGCGTAA GTTCGTGGAT AAGTAAAACA 
ATGGGGCCTA CATTAGCTTA CTTAGCAGGT TGGACTTATT GGGTGGTACA TGTGCCTTAT 
TTAGCGCAAA AACCACAAGC AGTACTTGTT TCATTAGGAT GGGCAGTATT CCAAGATGGA 
AGCACTATAA AAGGTATAGA TTCTAAAATT ATTCAATTAG TATGTTTAGT AGTATTCTTA 
TTCTTTGTAT GGATTGCCTC AAGAGGAGTA AATTCATTAG GGAAAATAGG TACAATAGCA 
GGAACAGCAA TGTTTGTTAT GTCTATTCTT TATATAGTAC TTATGTTAAC AGCACCTGCT 
ATTACAGGAA CTTCTATAGC AAGTCCAAAT ATGACTTCTA TAAAAACCTA TATACCAAAA 
TTTGATTTTG CCTATTTTAC CACTATAGCT ATGTTAGTAT TCTCAGTTGG AGGAGCTGAA 
AAGATATCTC CATATGTTAA CAACATGAAA GATTCTAAAA AAGGTTTCTC AAAAGGTATG 
ATAGCTTTAG CTATAATGGT TGCAGTTACA GCACTTCTTG GATCAGTAGC AATGGGAATG 
ATGTTTGATG CAAATAATGT TCCTGATGAC TTAATGTTAA ATGGTGCTTA CTATGCATTC 
CAAAAGTTAG GTAATTATTA TGGAATAGGA AATTCTTTAT TAATATTATA TGCATTAGCA 
AACTTTGCAG CTCAAGTTTC AGCATTAGTA TTCTCAATAG ATGCTCCATT AAAAGTTTTA 
TTATCAGATA CTGATGCAAG ATATGTTCCA ATAGCATTAA CTAAGACTAA TAAGAATGGG 
GCTCCAATAA ATGGATATAT AATGACTTCT ATTTTAGTTG GAATATTAAT AATAGTTCCA 
GCTTTAGGAA TTGGAAACTT TAATGCTTTA TTTACTTGGT TATTAAAATT AAATGCTGTT 
GTTATGCCAA TGAGATATTT ATGGGTATTC TTAGCTTACA TAATGTTAAG AAAAGCTATA 
AAAGGAAAGT TCAAATCAGA GTACAAATTT GTTAAAAATG ATAAATTCGC AATGTTAATA 
GGTACTTGGT GTTTTGTATT TACAGCATTT GCTTGTATAT TAGGTATGTT CCCAACAGAT 
GTTAAAGCAT TCTCAGGAGA ATGGATTTTC AGAGTAGGAA TGAATATTGG TACACCTTTA 
GTATTAATAG GATTAGGTTT AATATTACCT AAAATAGCTA AGAGAACTAA CGGACAAGCA 
TACAAGGATG CAGTAAGAGA AGCTACAGCA ACAAAGTTAG AACTTAATTA G

Protein sequence

MGNSNDGKKL MWYNLGLMAF VSVWGFGNVV NNFATQGLTV ITSWILIIAL YFVPYALMVG 
ELGSTFRDSK GGVSSWISKT MGPTLAYLAG WTYWVVHVPY LAQKPQAVLV SLGWAVFQDG 
STIKGIDSKI IQLVCLVVFL FFVWIASRGV NSLGKIGTIA GTAMFVMSIL YIVLMLTAPA 
ITGTSIASPN MTSIKTYIPK FDFAYFTTIA MLVFSVGGAE KISPYVNNMK DSKKGFSKGM 
IALAIMVAVT ALLGSVAMGM MFDANNVPDD LMLNGAYYAF QKLGNYYGIG NSLLILYALA 
NFAAQVSALV FSIDAPLKVL LSDTDARYVP IALTKTNKNG APINGYIMTS ILVGILIIVP 
ALGIGNFNAL FTWLLKLNAV VMPMRYLWVF LAYIMLRKAI KGKFKSEYKF VKNDKFAMLI 
GTWCFVFTAF ACILGMFPTD VKAFSGEWIF RVGMNIGTPL VLIGLGLILP KIAKRTNGQA 
YKDAVREATA TKLELN