Gene Ent638_3943 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_3943
Symbol
ID	5111595
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	-
Start bp	4267255
End bp	4268217
Gene Length	963 bp
Protein Length	320 aa
Translation table	11
GC content	51%
IMG OID	640494152
Product	biotin--protein ligase
Protein accession	YP_001178649
Protein GI	146313575
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0340] Biotin-(acetyl-CoA carboxylase) ligase
TIGRFAM ID	[TIGR00121] birA, biotin-[acetyl-CoA-carboxylase] ligase region [TIGR00122] BirA biotin operon repressor domain

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.596693
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.000472258
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGAGAGATA ATACCGTTCC ATTAACGCTG ATCAACATTC TTGCTGATGG TGAATTTCAC 
TCGGGCGAGC AACTGGGCGA GCGCCTGGGC ATGAGTCGTG CGGCGATCAA TAAACACATT 
CAGACCCTGC GCGACTGGGG CGTTGATGTT TTCACGGTAC CCGGAAAAGG CTATAGCTTG 
CCGGAACCTA TTCAGCTACT GGATGAGGAC GTCATTCGCA GCCAGTTGAA GCAGGGAAAA 
GTGACCGTTC TGCCCGTTAT TGATTCCACA AATCAGTATT TACTAGAACG TATCAATGAA 
CTGAACTCTG GTGACAGCTG CGTTGCTGAG TACCAGCAGG CCGGTCGGGG ACGTCGAGGG 
CGCAAGTGGT TCTCACCGTT TGGCGCAAAT CTCTATCTCT CAATGTTCTG GCGTCTTGAG 
CAAGGTCCGG CTGCCGCCAT CGGTTTAAGT CTGGTGATCG GTATTGTGAT TGCCGAAGTG 
CTTCACGACT TGGGCGCTGA TAAAGTCCGC GTAAAATGGC CTAACGACCT CTATCTGAAC 
GATCGGAAAC TTGCAGGTAT TTTGGTCGAA ATGACGGGGA AAACCGGGGA TGCTGCGCAG 
ATCGTGATCG GTGCGGGTCT TAATATGGTC ATGCGCAACG TGCAGACGGA TGTGGTCAAT 
CAGGGCTGGA TCACGCTGCA GGAAGCGGGC GTAACTATTG ATCGTAATAC CCTCGCTGTT 
CGCCTTATTA AAGAATTACG TGAGGCGTTA ACCCTCTTTG AGCAAGACGG GCTGTCACCG 
TTCCTGAGTC GTTGGGAAAA ACTAGATAAT TTTATCAACC GCCCGGTGAA ACTGATTATT 
GGTGATAAGG AAATCTTTGG CACCTCACGT GGTATCAATG CTCAAGGTGC TCTCCTGCTC 
GAACAGGAAG GTATTGTGAA GCCGTGGGTT GGTGGCGAAA TTTCACTGCG AAGCGCAGAA 
TAA

Protein sequence

MRDNTVPLTL INILADGEFH SGEQLGERLG MSRAAINKHI QTLRDWGVDV FTVPGKGYSL 
PEPIQLLDED VIRSQLKQGK VTVLPVIDST NQYLLERINE LNSGDSCVAE YQQAGRGRRG 
RKWFSPFGAN LYLSMFWRLE QGPAAAIGLS LVIGIVIAEV LHDLGADKVR VKWPNDLYLN 
DRKLAGILVE MTGKTGDAAQ IVIGAGLNMV MRNVQTDVVN QGWITLQEAG VTIDRNTLAV 
RLIKELREAL TLFEQDGLSP FLSRWEKLDN FINRPVKLII GDKEIFGTSR GINAQGALLL 
EQEGIVKPWV GGEISLRSAE