Gene Rru_A3074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rru_A3074
Symbol
ID	3836520
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodospirillum rubrum ATCC 11170
Kingdom	Bacteria
Replicon accession	NC_007643
Strand	-
Start bp	3539235
End bp	3540776
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	71%
IMG OID	637827189
Product	glycosyltransferase
Protein accession	YP_428156
Protein GI	83594404
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1807] 4-amino-4-deoxy-L-arabinose transferase and related glycosyltransferases of PMT family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0020891
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACGCTC CCTGGATCCA ATGCGCCACG GGAACGGCCG ATCGCGGCCG GGCGCTGTTG 
TATTCCCGCT GGGTCGGGCT GGCGGTGCTC TGCCTGCTGT GCCTCGTCCG CCTGTTGCTG 
AGCGCCGGCG GCACCATCCC CCCCCATCCC GACGAAGCGA TGCTCTGGGC CGCCGGTCAG 
CCGTTGGGGG CCGTCCTGGG CGGCGACCAC CCTTTGGTTT CGCTGATCCT GTCGGCCAGC 
GTCGAGCTTC TGGGCAATAC GGTTTTCGCC CTGCGCGCCC CCGGGGTGAT CGCCCTTGGC 
CTTGCCAGCA TCGCCGTCTG GCGGCTGGCC GGGCTGCTCT ATGACGCCCG GGTGGCTTTT 
TGGGCCGCCG TGGTCTTCGC CACCCTGCCG GTGGTCTCCT ATGCCTCGGC CATCGCCGGA 
ACGGCGGGGT TCCTGCCGCT GTTCTGGGCG GTGGCCCTGC ATGGGCTGCT GCGCGGCCTG 
AAGAGCGATT CCCTGGTTTG GTGGCTTGTT TTGGGCACGG CCTTCGGGCT TGGCCTGTTG 
ACCGACGGGG CGATGGCGCT TTTGGTGCCG TGCTTCCTGC TCTATGGCCT GCTGTCGCCC 
GAATACCATG CCCTGTGGCG GCGCCGGGGC CTGTGGCTGG CTTTGGGTCT GGGCTTGGCG 
ATCGCCGCCC CCGCCTTTTG GGCCGGTCTT CTGCACGCCG ATCTCACCCC CCAGCCGACG 
CCGGCGGCGG GCTTCGCCTT CCTGGTGGCC CAGGTCGCGG TTTTCGGGCC AATTCCGGCC 
ACCGTGCTGG CCTGGGTGGC GCTGCATCCC GGCGGCGGGG CGATGATCGG CGGATACGGG 
CCCGGTGACG AGCGCCGCGC CGCCGACGAG CGGGCGCGGC GCGGCTATCG CATCCGGTTC 
TTTCTGTCGT TCAGCCTGCC GGTGGTGGCC CTGGCCACCC TCGCCGCGGC GATGGGCGGC 
GCCCTGCCGG CGGAGGCGGC GGCGGTGGCC TATGTCGGCG GCGCCATCCT GGTGGCCTCG 
TGGCTGCTGA CGACGCCGTT GCGTCGCGGC CTGCTGCGGC TTTGCGTGGC GCTGCATATC 
CTGGGCGCCC TGCTGTTCTT CAATCTGGAT GGCCTGCTGC GCGACAGCGG CCTGCGCCCG 
CCCGCGGGGC TTGACCCCTT CGCCGATCTG CGCGGCATGG ACCGGGTGGC GGTTTGGGGC 
GGTGAACTGG CGGCGCGCTA TCCCGGGGTG CCGATGATCT TCGATGACCC GGGCATTCTG 
GCCAGCCTGC GCTTCCAGAG CCATCCCCGC TCCACCGTCA TGGTGCTGGC CAGCGCTCTG 
GGCGGAGCGG ATGCCATCGG TTTGGGACCG GCGCCCAACG GCATTCTGGT GATCACCCGC 
GCCCCGACCG GGCCCGATAC GCCCACTCCC GATACGCCCG CCGCCGATAC TTCCAATGAC 
GAGGGCGGGC GCGATGCCGG CTTCGTTGAT ATCGAAGCCG TTCCCGGGCG GTGGATATCG 
CTGCGCGCGC GCTTTCTGCC GCCCGCCGGA GAGCAACCAT GA

Protein sequence

MDAPWIQCAT GTADRGRALL YSRWVGLAVL CLLCLVRLLL SAGGTIPPHP DEAMLWAAGQ 
PLGAVLGGDH PLVSLILSAS VELLGNTVFA LRAPGVIALG LASIAVWRLA GLLYDARVAF 
WAAVVFATLP VVSYASAIAG TAGFLPLFWA VALHGLLRGL KSDSLVWWLV LGTAFGLGLL 
TDGAMALLVP CFLLYGLLSP EYHALWRRRG LWLALGLGLA IAAPAFWAGL LHADLTPQPT 
PAAGFAFLVA QVAVFGPIPA TVLAWVALHP GGGAMIGGYG PGDERRAADE RARRGYRIRF 
FLSFSLPVVA LATLAAAMGG ALPAEAAAVA YVGGAILVAS WLLTTPLRRG LLRLCVALHI 
LGALLFFNLD GLLRDSGLRP PAGLDPFADL RGMDRVAVWG GELAARYPGV PMIFDDPGIL 
ASLRFQSHPR STVMVLASAL GGADAIGLGP APNGILVITR APTGPDTPTP DTPAADTSND 
EGGRDAGFVD IEAVPGRWIS LRARFLPPAG EQP