Gene EcolC_3912 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3912
Symbol
ID	6064394
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	4297437
End bp	4298774
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	54%
IMG OID	641603326
Product	arginine:agmatin antiporter
Protein accession	YP_001726841
Protein GI	170021887
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0531] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.27107
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTTCGG ATGCTGATGC TCACAAAGTG GGCTTAATCC CCGTCACCCT GATGGTGTCG 
GGGAATATTA TGGGGTCAGG TGTTTTTCTG TTACCTGCAA ACCTGGCCTC TACTGGCGGG 
ATTGCCATTT ATGGATGGTT GGTGACGATT ATCGGTGCAC TGGGGCTCTC GATGGTATAC 
GCCAAAATGT CGTTCCTCGA CCCAAGTCCT GGTGGTTCTT ACGCTTACGC CCGCCGCTGC 
TTTGGCCCGT TTCTCGGTTA TCAAACCAAC GTCCTCTACT GGCTGGCCTG CTGGATCGGC 
AATATCGCCA TGGTGGTCAT TGGCGTAGGA TATTTAAGTT ACTTCTTCCC GATTCTGAAA 
GATCCATTGG TATTAACCAT CACCTGCGTC GTGGTGCTGT GGATCTTCGT CCTGCTGAAC 
ATTGTCGGTC CGAAAATGAT CACCCGTGTG CAGGCAGTTG CCACCGTGCT GGCGCTGATC 
CCCATCGTCG GGATTGCCGT ATTTGGCTGG TTCTGGTTCC GTGGTGAAAC CTATATGGCG 
GCATGGAACG TCAGCGGCCT GGGCACCTTC GGTGCAATTC AAAGTACCCT TAACGTTACG 
CTGTGGTCGT TCATCGGTGT GGAAAGTGCC TCCGTTGCCG CAGGTGTGGT GAAAAACCCG 
AAACGCAATG TCCCTATCGC CACCATTGGT GGGGTATTGA TTGCCGCCGT TTGCTATGTA 
CTTTCTACCA CCGCGATTAT GGGGATGATC CCTAATGCCG CACTGCGCGT TTCTGCTTCG 
CCATTCGGTG ATGCCGCACG GATGGCGTTG GGTGACACCG CCGGGGCCAT TGTTTCCTTC 
TGCGCAGCTG CGGGTTGCTT AGGTTCACTG GGCGGCTGGA CGTTGCTGGC GGGTCAAACG 
GCGAAAGCCG CTGCCGATGA CGGACTGTTC CCACCGATCT TTGCCCGTGT AAATAAAGCG 
GGTACGCCAG TGGCGGGGCT GATTATCGTC GGTATTTTGA TGACCATCTT CCAGCTCAGC 
AGCATTTCAC CAAACGCGAC CAAAGAGTTC GGTCTGGTTT CTTCCGTCTC GGTCATCTTT 
ACACTGGTGC CATATCTTTA CACCTGTGCG GCGTTACTGC TGCTCGGACA CGGTCACTTT 
GGTAAAGCAC GCCCGGCATA TCTGGCAGTT ACTACCATTG CCTTCCTCTA CTGCATCTGG 
GCCGTGGTGG GGTCCGGAGC GAAAGAGGTT ATGTGGTCAT TTGTCACCCT GATGGTCATC 
ACCGCCATGT ATGCGCTGAA TTACAACCGG CTACATAAAA ACCCGTATCC CTTAGATGCA 
CCAATAAGCA AAGATTAA

Protein sequence

MSSDADAHKV GLIPVTLMVS GNIMGSGVFL LPANLASTGG IAIYGWLVTI IGALGLSMVY 
AKMSFLDPSP GGSYAYARRC FGPFLGYQTN VLYWLACWIG NIAMVVIGVG YLSYFFPILK 
DPLVLTITCV VVLWIFVLLN IVGPKMITRV QAVATVLALI PIVGIAVFGW FWFRGETYMA 
AWNVSGLGTF GAIQSTLNVT LWSFIGVESA SVAAGVVKNP KRNVPIATIG GVLIAAVCYV 
LSTTAIMGMI PNAALRVSAS PFGDAARMAL GDTAGAIVSF CAAAGCLGSL GGWTLLAGQT 
AKAAADDGLF PPIFARVNKA GTPVAGLIIV GILMTIFQLS SISPNATKEF GLVSSVSVIF 
TLVPYLYTCA ALLLLGHGHF GKARPAYLAV TTIAFLYCIW AVVGSGAKEV MWSFVTLMVI 
TAMYALNYNR LHKNPYPLDA PISKD