Gene SNSL254_A3643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3643
Symbol	accC
ID	6482739
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	3532617
End bp	3533966
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	55%
IMG OID	642738918
Product	acetyl-CoA carboxylase biotin carboxylase subunit
Protein accession	YP_002042635
Protein GI	194444408
COG category	[I] Lipid transport and metabolism
COG ID	[COG0439] Biotin carboxylase
TIGRFAM ID	[TIGR00514] acetyl-CoA carboxylase, biotin carboxylase subunit

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.4794
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.0000582777
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTTGGATA AAATTGTCAT CGCCAACCGC GGCGAGATCG CACTACGTAT TCTTCGAGCC 
TGTAAAGAAC TCGGCATCAA GACCGTCGCT GTGCACTCAA GCGCGGATCG CGATTTAAAA 
CACGTATTGC TGGCGGATGA GACGGTCTGT ATTGGTCCGG CACCGTCCGT AAAAAGTTAT 
CTGAACATCC CGGCTATCAT TAGCGCCGCT GAAATCACCG GCGCGGTGGC AATCCACCCG 
GGTTACGGCT TCCTTTCTGA GAACGCCAAT TTTGCCGAGC AGGTTGAACG CTCCGGCTTT 
ATCTTTATCG GCCCGAAAGC GGACACCATC CGCCTGATGG GCGATAAAGT GTCCGCGATT 
ACCGCGATGA AAAAAGCGGG CGTGCCGACC GTACCAGGAT CTGACGGCCC GCTGGGCGAC 
GATATGAATG CGAACCGCGC TCATGCCAAA CGTATTGGCT ATCCGGTGAT CATCAAAGCG 
TCCGGCGGCG GCGGCGGCCG CGGTATGCGC GTGGTTCGTA GCGATGCTGA ACTGGCGCAG 
TCCATCTCCA TGACCAAAGC GGAAGCGAAA GCGGCTTTCA GCAACGACAT GGTATACATG 
GAAAAATACC TGGAAAATCC ACGCCACATC GAAATTCAGG TGCTGGCGGA CGGCCAGGGC 
AACGCTATCT ATCTGGCGGA ACGCGACTGT TCCATGCAGC GTCGCCACCA GAAAGTGGTT 
GAAGAAGCCC CGGCGCCAGG CATTACGCCG GAACTGCGTC GCTATATCGG CGAACGCTGC 
GCGAAAGCGT GCGTAGACAT CGGCTATCGC GGCGCAGGGA CGTTCGAATT CCTGTTCGAA 
AACGGCGAGT TCTATTTCAT CGAAATGAAC ACCCGTATTC AGGTTGAACA CCCGGTGACT 
GAAATGATTA CTGGCGTCGA TTTGATCAAA GAGCAGTTGC GCATCGCGGC GGGTCAGCCG 
CTGTCGATCA CACAGGACGA AGTTGTCGTT CGAGGCCATG CGGTAGAATG CCGTATCAAT 
GCCGAAGATC CGAACACCTT CCTGCCAAGC CCAGGCAAAA TCACGCGCTT CCATGCGCCT 
GGCGGCTTTG GCGTTCGCTG GGAATCTCAT ATCTACGCGG GCTACACGGT GCCGCCGTAC 
TATGATTCCA TGATCGGCAA ACTCATCTGC TACGGTGAAA ACCGCGACGT GGCGATTGCC 
CGTATGAAAA ATGCCCTGCA GGAACTGATT ATCGATGGTA TCAAAACCAA TATCGATCTG 
CAGACCCGCA TCATGAATGA CGAGCACTTC CAGCACGGTG GAACCAACAT CCACTATCTG 
GAGAAAAAAC TCGGTCTTCA GGAAAAGTAA

Protein sequence

MLDKIVIANR GEIALRILRA CKELGIKTVA VHSSADRDLK HVLLADETVC IGPAPSVKSY 
LNIPAIISAA EITGAVAIHP GYGFLSENAN FAEQVERSGF IFIGPKADTI RLMGDKVSAI 
TAMKKAGVPT VPGSDGPLGD DMNANRAHAK RIGYPVIIKA SGGGGGRGMR VVRSDAELAQ 
SISMTKAEAK AAFSNDMVYM EKYLENPRHI EIQVLADGQG NAIYLAERDC SMQRRHQKVV 
EEAPAPGITP ELRRYIGERC AKACVDIGYR GAGTFEFLFE NGEFYFIEMN TRIQVEHPVT 
EMITGVDLIK EQLRIAAGQP LSITQDEVVV RGHAVECRIN AEDPNTFLPS PGKITRFHAP 
GGFGVRWESH IYAGYTVPPY YDSMIGKLIC YGENRDVAIA RMKNALQELI IDGIKTNIDL 
QTRIMNDEHF QHGGTNIHYL EKKLGLQEK