Gene Lcho_2303 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lcho_2303
Symbol
ID	6163555
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Leptothrix cholodnii SP-6
Kingdom	Bacteria
Replicon accession	NC_010524
Strand	-
Start bp	2500114
End bp	2501724
Gene Length	1611 bp
Protein Length	536 aa
Translation table	11
GC content	73%
IMG OID	641665073
Product	protein of unknown function DUF894 DitE
Protein accession	YP_001791334
Protein GI	171058985
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCCAC CCGCCAAGCC GCCCCTGGTC GACCGCCTGC CGCCCACCCT GCAGGCGCTG 
ACGCTGCCGG TGTTCCGGAT GTTGTGGCTG GCCTGGCTGG CCGCCAACCT GACGATGTGG 
ATGAACGACG TCGCGGCCGC CTGGCTGATG ACGCAGCTCA CCGACAGCGC GGTGATGGTG 
GCGCTGGTGT CGGCGGCGTC GACCCTGCCG GTGTTCCTGC TCGGCATCCC CAGCGGTGCG 
CTGGCCGACA TCATCGACCG CCGGCGCTGG TTCGCCGCCA CCCAGCTGTG GGTCGCCAGC 
GTGGCGGTGC TGCTGGCGCT GCTGAGCCTG GGCGACGGGC TCGATGCCCA GCTGCTGCTG 
GCGCTGACCT TTGCCAACGG CATCGGCCTG GCGATGCGCT GGCCGGTGTT CGCGGCCATC 
GTGCCCGACA TCGTGCCGCG CGAGCGGCTG TCGGGGGCGC TGGCGCTGCA GGCGCTGGCG 
ATGAACATCT CGCGCGTGGT CGGGCCGATG TTTGCCGGCG CGCTGCTGGC GGCGTCGGGC 
AGCACCGCGG TGTTCGTGTT GAACGCGCTG CTGTCGCTGG TGGCGTTTGC GCAGGTGCTG 
CGCTGGAAGA GCCCGCCGCG CGTCAGCGCC TTGCCGGGCG AGCGTTTCGT CGGTGCCATG 
CGGGTCGGCC TGCAGCATGT GCGGCAGAGC CCGCGCATGA AGGCGGTGCT GGTGCGGGTG 
TTCCTGTTCT TCGTGCAGAG CATGGCGCTG ACCGCGCTGC TGCCGCTGGT GGCGCGCCGG 
CTCGGCAGCG GGGCCGGCGG CTTCACGCTG CTGGTGTCGT CGATGGGGGT GGGCGCGGTG 
GCGGCGGCGC TCACGGTGCC GCAGTTGCGC GAGAAGGTCA CGCGCGACGC CATCGCGCTG 
TGGGGCACGC TGATCGTCTC GACCGCCACG CTGGCGGTGG CGTTTGCGCC GGCCTTGTGG 
ATCGCCGCGC TGGCGATGGT GGTGGCCGGC GTGGCCTGGA TCAGCACCGC CAACACCATG 
ACCATGTCGG CCCAGCTGGC CTTGCCCAAC TGGGTGCGGG CACGTGGCAT GTCGGTCTAT 
CAGATGGCCT TGATGGGCGG CTCGGCCGGC GGCGCGGTGC TGTGGGGCCA GGTGGCCGAG 
CGCGCCAGCG TGCCGGCGGC GCTGGTGACC GCCGCGGCGC TGGGCCCGCT GGTGCTGCTG 
CTGACGCGGC GCCTGAGCCT GGGGGGCGGG CAGGACGAAG ACCTGAGCGC GATGCCGGCC 
CACCCGGTGC CGGCGCCGGC CTTCAGCTTC GAGCCCGACC GCGGGCCGGT GATGGTGACG 
GTCGAGTACC TGATCGACCC GGCCGACGGC GACGCCTTCC GCGCCGTGAT GCAGGACACC 
CGGCGCGCGC GGCTGCGCCA GGGCGCGCTG TCGTGGGGGC TGTTCCGCGA CACGGCGCAG 
ACCGGGCGCT ACATCGAGTA TTTCGTCGAC GAGTCCTGGG TCGAGCACCA GCGCCGCATG 
GAGCGTTTCA CCGCCGCCGA CATCGGCCTG CGCGACCGCC GCCTGGCCTT CCACCGCGGC 
AGCGAGATCC CGCGCGTGAC GCGCTATCTG GCCGAGGATC TCGATGTCTG A

Protein sequence

MNPPAKPPLV DRLPPTLQAL TLPVFRMLWL AWLAANLTMW MNDVAAAWLM TQLTDSAVMV 
ALVSAASTLP VFLLGIPSGA LADIIDRRRW FAATQLWVAS VAVLLALLSL GDGLDAQLLL 
ALTFANGIGL AMRWPVFAAI VPDIVPRERL SGALALQALA MNISRVVGPM FAGALLAASG 
STAVFVLNAL LSLVAFAQVL RWKSPPRVSA LPGERFVGAM RVGLQHVRQS PRMKAVLVRV 
FLFFVQSMAL TALLPLVARR LGSGAGGFTL LVSSMGVGAV AAALTVPQLR EKVTRDAIAL 
WGTLIVSTAT LAVAFAPALW IAALAMVVAG VAWISTANTM TMSAQLALPN WVRARGMSVY 
QMALMGGSAG GAVLWGQVAE RASVPAALVT AAALGPLVLL LTRRLSLGGG QDEDLSAMPA 
HPVPAPAFSF EPDRGPVMVT VEYLIDPADG DAFRAVMQDT RRARLRQGAL SWGLFRDTAQ 
TGRYIEYFVD ESWVEHQRRM ERFTAADIGL RDRRLAFHRG SEIPRVTRYL AEDLDV