Gene EcolC_1103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1103
Symbol
ID	6065232
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1200881
End bp	1202503
Gene Length	1623 bp
Protein Length	540 aa
Translation table	11
GC content	53%
IMG OID	641600519
Product	L-aspartate oxidase
Protein accession	YP_001724097
Protein GI	170019143
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0029] Aspartate oxidase
TIGRFAM ID	[TIGR00551] L-aspartate oxidase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.369167
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATACTC TCCCTGAACA TTCATGTGAC GTGTTGATTA TCGGTAGCGG CGCAGCCGGG 
CTTTCACTGG CGCTACGCCT GGCTGACCAG CATCAGGTCA TCGTTCTAAG TAAAGGCCCG 
GTAACGGAAG GTTCAACATT TTATGCCCAG GGCGGTATTG CCGCCGTGTT TGATGAAACT 
GACAGCATTG ACTCGCATGT GGAAGACACA TTGATTGCCG GGGCTGGTAT TTGCGATCGC 
CATGCAGTTG AATTTGTCGC CAGCAATGCA CGATCCTGTG TGCAATGGCT AATCGACCAG 
GGGGTGTTAT TTGATACCCA CATTCAGCCG AATGGCGAAG AAAGCTACCA TCTGACCCGT 
GAAGGTGGAC ATAGTCACCG TCGTATTCTT CATGCCGCCG ACGCAACTGG TAGAGAAGTA 
GAAACCACGC TGGTGAGCAA GGCGCTGAAC CATCCGAATA TTCGCGTGCT GGAGCGCAGC 
AACGCGGTTG ATCTGATTAT TTCTGACAAA ATTGGCCTGC CGGGCACGCG ACGGGTTGTT 
GGCGCGTGGG TATGGAACCG TAATAAAGAA ACGGTGGAAA CCTGCCACGC AAAAGCGGTG 
GTGCTGGCAA CTGGCGGTGC GTCGAAGGTT TATCAGTACA CCACCAATCC GGATATTTCT 
TCTGGCGATG GCATTGCTAT GGCGTGGCGC GCAGGCTGCC GGGTTGCCAA TCTCGAATTT 
AATCAGTTCC ACCCTACCGC GCTATATCAC CCACAGGCAC GCAATTTCCT GTTAACAGAA 
GCACTGCGCG GCGAAGGCGC TTATCTCAAG CGCCCGGATG GCACGCGTTT TATGCCCGAT 
TTTGATGTGC GCGGCGAACT GGCCCCGCGC GATATTGTCG CCCGCGCCAT TGACCATGAA 
ATGAAACGCC TCGGCGCGGA TTGTATGTTC CTTGATATCA GCCATAAGCC CGCTGATTTT 
ATTCGCCAGC ATTTCCCGAT GATTTATGAA AAATTGCTCG GGCTGGGGAT TGATCTCACA 
CAAGAACCGG TACCGATTGT GCCTGCTGCA CACTATACCT GCGGTGGTGT AATGGTTGAT 
GATCATGGGC GTACGGACGT CGAGGGCTTG TATGCCATTG GCGAGGTGAG TTATACCGGC 
TTACACGGCG CTAACCGCAT GGCCTCGAAT TCATTGCTGG AGTGTCTGGT CTATGGCTGG 
TCGGCGGCGG AAGATATCAC CAGACGTATG CCTTATGCCC ACGACATCAG TACGTTACCG 
CCGTGGGATG AAAGCCGCGT TGAGAACCCT GACGAACGGG TAGTAATTCA GCATAACTGG 
CACGAGCTAC GTCTGTTTAT GTGGGATTAC GTTGGCATTG TGCGCACAAC GAAGCGCCTG 
GAACGCGCCC TGCGGCGGAT AACCATGCTC CAACAAGAAA TAGACGAATA TTACGCCCAT 
TTCCGCGTCT CAAATAATTT GCTGGAGCTG CGTAATCTGG TACAGGTTGC CGAGTTGATT 
GTTCGCTGTG CGATGATGCG CAAGGAGAGT CGTGGCCTGC ATTTTACGCT GGATTACCCG 
GTACTGCTCA CGCATTCCGG TCCGTCGATC CTTTCCCCCG GCAATCATTA CATAAACAGA 
TAA

Protein sequence

MNTLPEHSCD VLIIGSGAAG LSLALRLADQ HQVIVLSKGP VTEGSTFYAQ GGIAAVFDET 
DSIDSHVEDT LIAGAGICDR HAVEFVASNA RSCVQWLIDQ GVLFDTHIQP NGEESYHLTR 
EGGHSHRRIL HAADATGREV ETTLVSKALN HPNIRVLERS NAVDLIISDK IGLPGTRRVV 
GAWVWNRNKE TVETCHAKAV VLATGGASKV YQYTTNPDIS SGDGIAMAWR AGCRVANLEF 
NQFHPTALYH PQARNFLLTE ALRGEGAYLK RPDGTRFMPD FDVRGELAPR DIVARAIDHE 
MKRLGADCMF LDISHKPADF IRQHFPMIYE KLLGLGIDLT QEPVPIVPAA HYTCGGVMVD 
DHGRTDVEGL YAIGEVSYTG LHGANRMASN SLLECLVYGW SAAEDITRRM PYAHDISTLP 
PWDESRVENP DERVVIQHNW HELRLFMWDY VGIVRTTKRL ERALRRITML QQEIDEYYAH 
FRVSNNLLEL RNLVQVAELI VRCAMMRKES RGLHFTLDYP VLLTHSGPSI LSPGNHYINR