Gene CPF_1520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1520
Symbol
ID	4201182
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	1736160
End bp	1737722
Gene Length	1563 bp
Protein Length	520 aa
Translation table	11
GC content	32%
IMG OID	638082398
Product	vanW-like family protein
Protein accession	YP_695963
Protein GI	110800526
COG category	[V] Defense mechanisms
COG ID	[COG2720] Uncharacterized vancomycin resistance protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.516908
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAAGAAG AAAAGAAGAA ATCAAGCACA GGCTTACTTA AAAGCAAAAA GAAAATAATA 
ATATCAATAG TTATTGTATT AGCAATTATA ATAGGTTCTA TTGTTGCATA TATAGTTAGT 
ATTCAGAAAA AAGTTGAAGA GTGGAATGAT AAGATATATC CTAACGTATA TGTTGAAAAT 
GTAAATTTAT CAGGAATGAC AAAGGAAAAG GCCATTGAGG TTTTAGAGAA GGATGTAAAA 
GAACCTGTAG AACATAAAAC TATAAAAGTT CAGGCGGCAG ATAAAAGTAT TGAAATAAAA 
TATTCTGATT TATCACCAGA ATATAATATA GATGAAACTG TTAATGAAGC TATGAATTAT 
GGAAAAGATT TAAATCTTTT TGAGAAAAAT AACCTTATAA ATGGAAAAGA TAAAAAGGAA 
TTAAATTTAG ATTTTAAATA TGATGAATCT AAGTTAACAG ATTATGAGAA AAAACTTACT 
GAAATGGTAA ATCAAAATGC TAAAAATGCT ACCATAAGTA TAAATGGTAG TAATATAAGT 
GTAATAGAAG GCGAAGATGG AAGAGCCATA GAAGAAGATA AAATGGTTTC TTTAGTAAAA 
GAAGCTATAA ATGCAAATCC AGAGGATAAT TCAGTTGTGG AAGTACCTGT AGAGGTTACA 
AAACCAAAAA TAACTAAGGA AATGCTTTCA AAAATAGACG GCGTTATAGG AAGTTTTACA 
ACAAGTTATA CAAGCTCAGA TGCTAATAGA AGTGCTAATG TTGAAATTGC AGCTAAAACG 
GTTAATGGAA CTATTTTAAT GCCAGGAGAT ACATTTAGTT ATAATAATAC TTTAGGGGAA 
AGAACCACAG CTAAGGGATA TAGAGATGGA GCGGCTTACG TAGGAAATAA AGTAGTAATG 
GTTACTGGTG GAGGAATCTG TCAAGTTTCT ACAACATTAT ACAGAGCTGT TTTAAGAGCT 
GGAATAATGC CAACAGAGAG ACATAATCAT AGTATGACAA CTACTTATTC AGGCCCAAGT 
GAAGATGCTA CAGTTTCATG GGGATCTTTA GACTATCAAT TTAAAAACCC TTATGATTTC 
CCAATATATA TACAAGGATA TACAAGTAAT AAACATGTAA CATTTAATAT ATATGGAAAT 
GTACAAGGTA TGGATGGAAA AACTTATGAA TTACAAACTG TAGTAAATGA AACTCTAAAA 
CCATCAGTTA AAACAGTTGA TGATCCTAAT TTGCCAGAGG GACAAAAAGT TGTTGAGCAA 
AGACCAGTTA CAGGATATAA GTCATCAGGA TATTTAGTAA CTTATCAAAA TGGAAAAGAA 
ATAGATAAGA AATTAATAGG ACATGATGTA TATAAACAAA AGGATGAAAT TATAAAGGTT 
GGAACAAAAA AAGCTGAGCA ACCAAAGCAA GAAGCACCAA AACAAGAACA GCCAGCTACT 
GCAAAGCCAG AGGAGCCAAA ACAAGAGGCA ACTCAGCCAT CAACATCACA ACCTGCTACA 
AATCAAGCAC CTGATGCAAC ACCTCAAACA CCTAATGCAG GGCAAACACC ACCAGCGCAG 
TAA

Protein sequence

MKEEKKKSST GLLKSKKKII ISIVIVLAII IGSIVAYIVS IQKKVEEWND KIYPNVYVEN 
VNLSGMTKEK AIEVLEKDVK EPVEHKTIKV QAADKSIEIK YSDLSPEYNI DETVNEAMNY 
GKDLNLFEKN NLINGKDKKE LNLDFKYDES KLTDYEKKLT EMVNQNAKNA TISINGSNIS 
VIEGEDGRAI EEDKMVSLVK EAINANPEDN SVVEVPVEVT KPKITKEMLS KIDGVIGSFT 
TSYTSSDANR SANVEIAAKT VNGTILMPGD TFSYNNTLGE RTTAKGYRDG AAYVGNKVVM 
VTGGGICQVS TTLYRAVLRA GIMPTERHNH SMTTTYSGPS EDATVSWGSL DYQFKNPYDF 
PIYIQGYTSN KHVTFNIYGN VQGMDGKTYE LQTVVNETLK PSVKTVDDPN LPEGQKVVEQ 
RPVTGYKSSG YLVTYQNGKE IDKKLIGHDV YKQKDEIIKV GTKKAEQPKQ EAPKQEQPAT 
AKPEEPKQEA TQPSTSQPAT NQAPDATPQT PNAGQTPPAQ