Gene CPR_1874 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1874
Symbol
ID	4206129
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	2069154
End bp	2070296
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	30%
IMG OID	642566424
Product	aspartate aminotransferase
Protein accession	YP_699184
Protein GI	110803801
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAAAA ATGTTATTGG GGTAGAAATA TCAGGAATAA GAAAATTCTA TAATGAAGTA 
GTAAAATTCC CAGAGGCTAT ATCATTAACT TTGGGACAGC CAGATTTTCC TGTTCCAGAA 
AAGGTTAAAG AAGCTATGAT AAGGGCTATT GAAGAAGGAA AGACAACATA TACAGCTAAT 
GCTGGTATAG TTGAATTGAG GGAAGAAATA TCAGGATTAC TAAAGAACAC TTTTGATATT 
GATTTTAGTA AGGATGAAAT AATTATAACT GTAGGTGGAA GTGAAGGGTT ATATGCAGCT 
ATGACAGCCA TTTTAAATCC AGGAGAGAAG GTTTTAGTTC CATCAATTGC ATATCCAGCT 
TATGAAAGCA TAAGCAAAAT AATAGGATGT GAAGTTATAA ATTACGATTT AAATGAAGAT 
TTTTCAGTTA ACATAGAAAG TTTAAAAGAA GGAATAAAAC AAGGGGGAAA ACTTTTAGTA 
CTTTCCTATC CATGTAATCC TACAGGTGCA TTACTTAGTA AAAAAAGTAG AGATGAATTA 
GTAGAGATTA TAAAAGAAAA TGATATCTTA GTATTAACTG ATGAAATTTA TTCATCCCTT 
TGTTTTGAAG AGGAGTATTA TTCTGTAGCT CAATGCAAGG ATATAAAAGA AAAAATAATA 
TATGTAAGTG GATTCTCTAA GATGTTTTCA ATGACAGGTC TTAGAATTGG ATATGTAGCA 
TGTTCTAAGG AAATATATGA TCAAATTATA AAGGTTCATC AATACAATTC TTCATGTGCA 
ACATCTATTT CTCAATGGGG AGCCTTAGAG GGATTAAAAT CTTGTATGAA TGATGTTGAA 
AACATGAAGG AATCTTTTAA AGAAAGAATG AATTTTACTT ATAAAAGATT AAAAAGTATG 
GGATTAGAAG TGGAAAAACC TAAAGGAGCT TTTTATATTT ATCCTAATAT AAGTAAGTTT 
GGATTAACAT CAGAAGAATT TTGTCATAGA TTACTTAAAG AAGGCAAAGT TGCTTGTGTA 
CCAGGAGATG CCTTTGGAAA AGGTGGAGAA GGGTATATTA GAATATCTTA CTGTTATAGC 
AAAGATGAAC TTGAAAGAGC TTTAGACAAA TTAGAGGATT TTATAAAATT TTTAAAAAAG 
TAA

Protein sequence

MNKNVIGVEI SGIRKFYNEV VKFPEAISLT LGQPDFPVPE KVKEAMIRAI EEGKTTYTAN 
AGIVELREEI SGLLKNTFDI DFSKDEIIIT VGGSEGLYAA MTAILNPGEK VLVPSIAYPA 
YESISKIIGC EVINYDLNED FSVNIESLKE GIKQGGKLLV LSYPCNPTGA LLSKKSRDEL 
VEIIKENDIL VLTDEIYSSL CFEEEYYSVA QCKDIKEKII YVSGFSKMFS MTGLRIGYVA 
CSKEIYDQII KVHQYNSSCA TSISQWGALE GLKSCMNDVE NMKESFKERM NFTYKRLKSM 
GLEVEKPKGA FYIYPNISKF GLTSEEFCHR LLKEGKVACV PGDAFGKGGE GYIRISYCYS 
KDELERALDK LEDFIKFLKK