Gene CPF_1672 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1672
Symbol
ID	4202100
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	1890817
End bp	1892205
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	33%
IMG OID	638082546
Product	sodium:alanine symporter family protein
Protein accession	YP_696110
Protein GI	110800336
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1115] Na+/alanine symporter
TIGRFAM ID	[TIGR00835] amino acid carrier protein

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.251428
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAACT TATTAAATCA AATCGACAAT TTAGTATGGG GAGTGCCACT TCTTATGCTG 
CTTGTAGGAA CAGGAATATA CCTGACTATA AGACTAAAAT TATTACAAAT TTTAAAATTA 
CCATTAGCCT TAAAGTATGT ATTTAAAAAA GATGAGGAAT CTACTTGTGA GGATGCAGAA 
GGAGATGTTT CAAGTTTTGG AGCCTTATGT ACAGCCCTTT CAGCTACTAT AGGTACTGGA 
AACATAGTTG GTGTTGCCAC TGCTATAAAG GCAGGGGGAC CAGGAGCATT ATTTTGGATG 
TGGGTAGCTG CTTTCTTTGG AATGGCAACT AAATATGCAG AAGGTGTACT TGCTATAAAG 
TATAGGGTTG TAGATGAAAA TGGTCAAATG GCTGGTGGAC CAATGTACTA TATAAAAAAC 
GGACTTGGTT TAAATTGGCT AGCTAATATT TTTGCTTTCT TTGGAATTGG TGTAGCTTTA 
TTAGGAATAG GAACTTTTGG ACAAGTTAAG TCCATAACTG ATGCAGCAAG TATTACATTT 
AATGTTCCTA CAATTATTAC AGCAGGAGTA GTAACTTTAT TAGTGGCTTT AGTAATTTTA 
GGTGGAATAA AAAGAATATC TAGCGTATCA GAAAAGGTAG TTCCTTTAAT GGCGGGACTT 
TATATATTAG GAGTTTTAAT TGTTATAGCT TTTAATTTAG ATAAGGTTCC ACATGCAGTA 
TCAATAATTA TTGAAAGTGC CTTTAATACT AAGGCTGCTT TAGGCGGAGC TGTAGGAGTT 
AGCATAATAA CTGTAATGAA AAGTGGAATA GCTAGAGGGG TTTTCTCTAA TGAAGCTGGG 
CTTGGAAGTG CTCCAATAGC AGCGGCGGCA GCTAAAACTA AGTCTCCAGT TAAGCAAGGA 
CTTATTTCAA TGACAGGTAC ATTCTTTGAT ACAATTCTTA TTTGTACAAT GACAGGTATA 
GTAATAATTC TTACTGGTGC TTATAGTGGA AGTTTAGAAG GAGCAGCACT TACAACACAG 
GCTTTTGAAA TAGGTCTTCC TATAAGTAAT ATAGGAACAT ATATAGTTAA TATAGGACTT 
ATGTTCTTTG CATTTACTAC AATATTAGGA TGGAACTATT ATGGAGAAAG ATGCATTGAG 
TATTTATTTG GAATAAAAGC TATAAAACCA TATAGAATTT TATATATAAT TTTAGTTGCT 
ATAGGATCAT TCTTACCATT AACATTAATA TTTATAATTG CAGATATTGT TAATGGATTA 
ATGGCAATTC CAAACCTTGT AGGTATTATT GGATTAAGAA AAGTAGTAAT AGAAGAAACA 
GAGGAATTCT TTAGGGAAAA AGCTTTAAGT GAAGAGAGTG CAGAATTAGA AGGAACTGTT 
TTAAATTAA

Protein sequence

MENLLNQIDN LVWGVPLLML LVGTGIYLTI RLKLLQILKL PLALKYVFKK DEESTCEDAE 
GDVSSFGALC TALSATIGTG NIVGVATAIK AGGPGALFWM WVAAFFGMAT KYAEGVLAIK 
YRVVDENGQM AGGPMYYIKN GLGLNWLANI FAFFGIGVAL LGIGTFGQVK SITDAASITF 
NVPTIITAGV VTLLVALVIL GGIKRISSVS EKVVPLMAGL YILGVLIVIA FNLDKVPHAV 
SIIIESAFNT KAALGGAVGV SIITVMKSGI ARGVFSNEAG LGSAPIAAAA AKTKSPVKQG 
LISMTGTFFD TILICTMTGI VIILTGAYSG SLEGAALTTQ AFEIGLPISN IGTYIVNIGL 
MFFAFTTILG WNYYGERCIE YLFGIKAIKP YRILYIILVA IGSFLPLTLI FIIADIVNGL 
MAIPNLVGII GLRKVVIEET EEFFREKALS EESAELEGTV LN